序 


In recent years processor IP has become ubiquitous as mobile and consumer device makers have migrated their designs from using stand-alone 
processor chips to processor cores integrated into more power-efficient System-on-Chips (SoCs) .At the same time,software functionality and 
complexity has increased at a dramatic rate,requiring additional processing bandwidth.Many of today’ s processors,including the ARC EM Family of 


processor IP cores,are focused on delivering increasing levels of performance with lower power consumption and a minimum silicon footprint. 


ARC EM processors were first introduced in 2012.Designed for ultra-low power operation, EM cores hit a sweet spot in processing efficiency and 
have since become Synopsys’ most successful processor product line. EM processors are now used in a wide variety of embedded 
applications,especially where exceptional performance-to-power (DMIPS/mW) or performance-to-atea (DMIPS/mm2) ratios are needed such as 


the Internet of Things (IoT) . 


The ARC EM family utilizes a scalable 16-/32-bit RISC instruction set architecture (ISA) that is optimized for the unique requirements of 
embedded and deeply embedded applications,such as performance efficiency and code density.Like all ARC processors, EM cores are highly 
configurable to enable designers to tailor each ARC processor instance to meet specific performance,power and area requirements. ARC processors ate 
also extendable,allowing designers to add their own custom instructions that accelerate application-specific code. The EM processor cores are supported 
by a robust ecosystem of software and hardware development tools,including an easy to use and low-cost ARC EM Starter Kit for early software 
development,the MQX real-time operating system (RTOS) ,the embARC Open Software Platform,and a broad portfolio of third-party tools,operating 


systems and middleware from leading industry vendors. 


Through the explanations and examples in this book,you will find the ARC EM processors ate easy to use and easy to program. The processors are 
extremely “C-ftiendly” meaning there is no need to optimize the applications with assembly.In some aspects,EM processors are easier to use than 
many 8-bit microcontrollers because of the simplicity of the linear memory architecture,an uncomplicated and yet flexible exception 


model,comprehensive debug features,and the software infrastructures provided by Synopsys and ecosystem partners. 


In 2012,we began expanding Synopsys?engineering development resources in China with a new ARC-focused R&D site in Wuhan,Hubei 
province.In addition to building the Synopsys team,we sought opportunities to build relationships with local universities and help educate future 
generations of engineers. The Huazhong University of Science and Technology (HUST) is one such university where a strong bond was 
formed.HUST is a public,coeducational research university located in Wuhan and 1s directly affiliated to the Ministry of Education of China. HUST 
professors and students led the way in working with us to develop a strong microprocessor design and programming curriculum,including coursework 
and hands-on labs.Our HUST collaborators have also been instrumental in co-authoring with Synopsys this book,which not only serves as a companion 
text for students taking the ARC-based course but will also serve as a valuable resource to professional software developers,chip design 


engineers, hobbyists and electronic enthusiasts of all shapes and sizes. 


Many thanks to all those people who have contributed to the publication of this book.I hope that you,the reader,find this book helpful for any 


processor-based project you are undertaking. Design on! 


— —Yankin Tanurhan, Vice-president of ARC R&D,Synopsys 


能 入 式 系统 (Embedded System) 3 —4 “HERKALEBHAR, ALG AMR S HAMA ， 根 据 英国 电气 工程 师 
协会 (U.K.Institution of Electrical Engineer) 的 定义 ， 谈 入 式 系统 为 控制 、 监 视 或 辅助 设备 、 机 器 ， 或 用 于 工厂 运作 的 设备 。 而 国内 首 遍 
认同 的 庶 入 式 系 统 的 定义 为 : 以 应 用 为 中 心 ， 以 计算 机 技术 为 基础 ， 软 硬件 可 裁剪 ， 适 应 应 用 系统 对 功能 、 可 靠 性 、 成 本 、 体 积 、 功 耗 
等 严格 要 求 的 专用 计算 机 系统 。 与 个 人 计算 机 这 样 的 通用 计算 机 系统 不 同 ， 认 入 式 系统 通常 执行 的 是 带 有 特定 要 求 的 预先 定义 的 任务 。 


本 书 以 实际 的 庶 入 式 系 统 广 品 应 用 与 开发 为 主线 ， 力 求 透 彻 讲解 开发 中 所 涉及 的 庞大 而 复杂 的 相关 知识 。 


本 书 第 1~5 章 为 基础 入 ， 介 绍 了 ARC 谱 入 式 系统 的 基础 知识 和 开发 过 程 中 需要 的 一 些 理论 知识 ， 具 体 包 括 ARC 谈 入 式 系统 概述 、 
ARC EM 处 理 器 介绍 、ARC EM 编程 模型 、 中 断 及 异种 处 理 、 汇 编 语言 程序 设计 等 内 容 。 第 6~9 章 为 实践 篇 ， 介 绍 了 如 何 建立 芥 入 式 开发 
环境 、 搭 建 府 入 式 硬件 开发 平台 等 ， 具 体 包 括 ARC EM 处 理 器 的 开发 及 调试 环境 MQX 实 时 操作 系统 、ARC EM Starter Kit FPGA 开 发 板 
以 及 内 入 式 系统 应 用 开发 实例 等 内 容 。 第 10~11 章 介绍 了 ARC EM 处 理 器 特有 的 可 配置 及 可 扩展 APEX 属 性 ， 以 及 如 何在 处 理 器 设计 中 利 
用 这 种 可 配置 及 可 扩展 性 实现 优化 设计 。 


本 书 不 仅 详细 讲解 基础 理论 知识 ， 还 提供 了 大 量 的 开发 案例 供 读 者 参考 ， 学 习性 和 实用 性 强 ， 既 可 供 从 事 谱 入 式 系 统 设 计 、 开 发 的 
广大 科技 人 员 阅 读 ， 也 可 以 作为 大 专 院 校 电子 科学 与 技术 、 集 成 电路 与 集成 系统 、 微 电子 科学 与 工程 、 物 联网 工程 、 电 子 人 信息、 自动 控 
制 专业 及 其 他 相关 专业 的 教材 或 参考 书 。 


本 书 是 华中 科技 大 学 -Synopsys ARC 处 理 器 联合 培训 中 心 的 力作 ， 系 统 介绍 应 用 Synopsys ARC 处 理 器 进行 误 入 式 系统 开发 与 编程 。 为 
了 使 广大 学 生 和 研发 工程 师 尽 快 党 握 ARC EM 处 理 器 的 使 用 ， 更 好 地 推广 Synopsys ARC 处 理 器 技术 与 产品 ， 在 Synopsys 全 球 总 部 、 
Synopsys 武 汉 公 司 、Synopsys ARC 研 发 团队 、 华 中 科技 大 学 光学 与 电子 信息 学 院 微 电 子 工程 系 、 武 汉 微 电子 学 院 及 机 械 工 业 出 版 社 华章 
公司 的 支持 下 ， 我 们 编著 了 此 书 ， 目 的 是 为 广大 读者 提供 一 本 较为 完整 、 系 统 的 ARC EM 误 入 式 系统 开发 与 编程 参考 书 。 本 书 主要 以 
ARC EM 原版 数据 手册 的 内 容 为 基础 ， 增 加 了 ARC EM 处 理 器 特有 的 可 配置 及 可 扩展 APEX 属 性 等 内 容 。 为 了 方便 学 习 和 实践 ， 我 们 还 开 


发 了 较为 完整 的 配套 实验 案例 ， 以 及 一 个 艇 入 式 系 统 应 用 实例 温度 自动 监测 模块 。 


本 书 由 华中 科技 大 学 武汉 国际 微 电 子 学 院 及 华中 科技 大 学 光学 与 电子 信息 学 院 雷 狗 铭 老 师 负 责 组 织 并 完成 全 书 的 编著 工作 ， 华 中 科 
技 大 学 郑 朝 霞 副教授 、 邹 雪 城 教授 对 本 书 进行 了 审 校 。 参 与 本 书 编写 和 整理 、 软 硬件 设计 和 案例 开发 验证 等 工作 的 有 Synopsys 公 司 的 吴 
丹 、 程 松 波 、 程 文 、 涂 申 俊 、 饶 金 理 、 沈 金 阳 、 陈 鹏 、 胡 振 波 、 彭 剑 英 以 及 华中 科技 大 学 武汉 微 电 子 学 院 的 彭 自 强 、 向 灯 、 黄 之 、 许 
最 、 安 志 浩 、 顾 云 眉 、 高 文 、 钟 媛 、 高 弘扬 、 郑 贤 、 符 章 等 。 在 本 书 完 成 过 程 中 ， 还 得 到 了 Synopsys 武 汉 公 司 王 芯 及 机 械 工 业 出 版 社 华 


章 公 司 的 大 力 支 持 ， 在 此 向 他 们 表示 衰 心 的 感谢 。 特 别 感谢 文 华 学 院外 国语 学 院 英 语系 肖 艳 梅 老师 的 审 校 工作 。 


由 于 时 间 人 仓促 和 水 平 有 限 ， 同 时 在 成 书 过 程 中 Synopsys 公 司 的 官方 资料 还 在 不 断 更 新 ， 所 以 本 书 有 些 内 容 不 尽 完 善 ， 错 误 之 处 也 在 
所 难免 ， 尽 请 读者 批评 指正 ， 以 便 我 们 及 时 修正 。 有 关 此 书 的 信息 和 配套 资源 ， 会 及 时 发 布 在 网 站 上 (网 址 
7j http:/ /www.embatc.otg) o 


第 1 章 ARCHA IRIAN 


本 章 主 要 介绍 竺 入 式 系统 的 定义 、 衣 入 式 系 统 的 主要 特点 和 内 入 式 系统 的 各 个 组 成 部 分 ， 使 读者 对 仍 入 式 系统 有 较为 系统 的 认识 。 
同时 还 简要 地 介绍 ARC EM 处 理 器 系列 特点 ， 以 及 基于 ARC EM 处 理 器 的 众 入 式 系统 开发 环境 。 


1.1. ERARA GIT 


近年 来 ， 随 肴 以 计算 机 技术 、 通 信和 技术 为 主 的 信息 技术 的 快速 及 展 和 Internet 的 普及 ， 岁 入 陈 系 统 得 到 了 赵 来 越 三 泛 的 应 用 及 友 
展 。 饼 入 式 系 统 是 以 应 用 为 中 心 ， 以 计算 机 技术 为 基础 ， 软 硬件 可 裁剪 (这 是 指骨 入 式 系 统 的 大 小 和 规格 可 随 着 具体 应 用 需求 而 改 
变 ) ， 适 用 于 应 用 系统 对 功能 、 可 靠 性 、 成 本 、 体 积 、 功 耗 有 严格 要 求 的 专用 计算 机 系统 。 


根据 英国 电气 工程 师 协 会 (U.K.Institution of Electrical Engineer) 的 定义 ， 艇 入 式 系统 (Embedded System) 为 控制 、 监 视 或 
辅助 设备 、 机 器 ， 或 用 于 工厂 运作 的 设备 。 


根据 中 文 维基 百科 的 定义 : 藤 入 式 系 统 是 一 种 完全 藤 入 受 控 器 件 内 部 ， 为 特定 应 用 设计 的 专用 计算 机 系统 。 与 个 人 计算 机 等 通用 计 
算 机 系统 不 同 ， 骨 入 式 系 统 通 常 执行 的 是 市 有 特定 要 求 的 预先 定义 的 任务 。 由 于 调 入 式 系 统 只 针对 一 项 特殊 的 任务 ， 设 计 人 员 能 够 对 其 
进行 功能 最 佳 化 、 系 统 最 小 化 设计 ， 从 而 达到 降低 成 本 的 目的 。 


忌 之 ， 馈 入 式 系 统 是 面向 用 尸 、 面 向 产品 、 面 向 应 用 的 ， 必 须 与 具体 应 用 相 结 合 才 会 具有 生命 力 和 优势 。 因 此 可 以 这 样 理解 上 述 三 
个 面向 的 含义 ， 即 嵌入 式 系 统 是 与 应 用 紧密 结合 的 ， 它 具有 很 强 的 专用 性 ， 必 须 结合 实际 系统 需求 进行 合理 的 设计 。 


芯 入 式 系 统 主要 由 硬件 层 、 中 间 层 、 系 统 软 件 层 和 应 用 软件 层 组 成 。 


` 硬件 层 包 含 谱 入 式 处 理 器 、 存 储 器 、 通 用 设备 接口 和 1/O 〇 O (Input/Output， 输 入 /输出 ) 接口 。 在 单 片 溢 入 式 处 理 器 基础 上 添加 电 
源 电 路 、 时 钟 电 路 和 存储 器 电路 ， 就 构成 了 一 个 谱 入 式 核 心 控制 模块 。 


| 硬件 层 与 软件 层 之 间 为 中 间 层 ， 也 称 为 硬件 抽象 层 或 板 级 支持 包 (Board Support Package , BSP) 。 它 将 系统 上 层 软 件 与 底层 硬件 
分 离 ， 使 系统 的 底层 驱动 程序 与 硬件 无 关 ， 上 层 软 件 开 发 人 员 无 需 关 心底 层 硬 件 的 具体 细节 ， 只 要 根据 BSP 层 提供 的 接口 即 可 进行 开 
发 。 该 层 一 般 包 含 相 关 底 层 硬 件 的 初始 化 、 数 据 的 输入 /输出 操作 和 硬件 设备 的 配置 功能 。 


系统 软件 层 由 实时 多 任务 操作 系统 、 文 件 系 统 、 图 形 用 户 接口 、 网 络 系统 及 通用 组 件 模块 组 成 。RTOS (Real Time Operating 
System， 实 时 操作 系统 ) 是 浴 入 式 应 用 软件 的 基础 和 开发 平台 。 


+ 应 用 软件 层 指 用 户 可 以 使 用 的 各 种 程序 设计 语言 ， 以 及 用 各 种 程序 设计 语言 编制 的 应 用 程序 的 集合 。 


其 中 ， 褒 入 式 处 理 器 是 藤 入 式 系 统 的 核心 组 成 部 分 ， 它 由 通用 计算 机 中 的 CPU (Central Processing Unit， 中 央 处 理 器 ) 演变 
来 ， 与 通用 CPU 最 大 的 不 同 在 于 峙 入 式 处 理 器 主要 工作 在 为 特定 用 户 群 所 专门 设计 的 系统 中 ， 它 将 通用 CPU 中 许多 由 板 卡 完成 的 任务 集 
成 在 芯片 内 部 ， 从 而 有 利于 嵌入 式 系 统 在 设计 时 趋 于 小 型 化 ， 同 时 还 具有 很 高 的 效率 和 可 靠 性 。 


蔚 入 式 处 理 器 的 体系 结构 一 般 采 用 冯 : 庄 依 曼 结 构 或 哈佛 结构 ， 措 令 系 统 采 用 复杂 指令 集 (Complex Instruction Set 
Computer, CISC) 结构 或 精简 指令 集 (Reduced Instruction Set Computer, RISC) 结构 。 据 不 完全 统计 ， 全 球 肉 入 式 处 理 器 已 经 
超过 1000 和 种， 其 中 主流 的 体系 有 ARM、MIPS、PowerPC、ARC、X86 等 。 


1.2 ARC 处理 器 简介 


ARC 处 理 器 是 yynopsys 公 司 推出 的 系列 32 位 RISC 结 构 微 处 理 器 产品 ， 致 力 于 在 满足 应 用 所 需 的 处 理性 能 前 提 下 ， 以 尽 可 能 低 的 处 
理 器 功 耗 和 尽 可 能 小 的 心 片 面积 实现 高 效能 、 低 成 本 。 


ARC 处 理 器 具有 独特 的 可 配置 和 可 扩展 特性 ， 给 工程 设计 人 员 提 供 了 极 大 的 设计 弹性 。 设 计 人 员 可 以 根据 应 用 需求 ， 选 择 相应 的 
ARC 处 理 器 产品 系列 ， 配 置 处 理 器 总 线 接口 类 型 、 数 据 位 宽 、 寻 址 位 宽 、 指 令 类 型 等 属性 。 处 理 器 内 部 的 各 功能 模块 也 文 持 可 配置 ， 例 
如 配置 乘法 器 及 用 不 同 算法 实现 ， 配 置 高 速 缓存 Cache 的 容量 和 结构 ， 配 置 中 断 处 理 单 元 所 支持 的 中 断 数 目 和 中 断 级 数 等 。 此 外 ，ARC 
处 理 器 支持 嵌入 式 系 统 设计 工程 师 通 过 处 理 器 的 APEX 扩 展 接口 添加 自己 的 定制 指令 、 寄 存 器 、 硬 件 模 块 甚至 是 协 处 理 器 ， 为 特定 应 用 
提供 硬件 加 速 。 这 种 根据 应 用 “ 量 身 裁 问 ”的 设计 方式 使 得 工程 师 可 以 在 性 能 、 面 积 、 功 耗 之 间 进 行 权衡 ， 以 实现 最 佳 的 内 核 


PPA (Performance/Power/Area， 性 能 / 功 耗 /效率 ) 。 


ARC 处 理 器 采用 了 高 效 的 16/32 位 混合 指令 集体 系 结构 。 其 中 ，16 位 指令 包含 最 常用 的 指令 操作 类 型 ， 有 助 于 提高 代码 密度 。ARC 
处 理 器 的 存储 系统 支持 配置 片上 存储 器 CCM (Closely Coupled Memory， 紧 耦合 存储 器 ) ， 便 于 以 固定 延迟 (1~ 2 个 时 钟 周 期 ) 访问 
应 用 中 性 能 关键 的 代码 和 数据 ， 不 仪 有 利于 缓解 片 外 总 线 访 存 压力 ， 降 低 系 统 访 存 延迟 ， 提 高 处 理性 能 ， 还 有 助 于 提高 系统 集成 度 ， 降 
低 系 统 成 本 。 


ARC 处 理 器 具有 强大 的 中 断 / 寞 单 处 理 能 力 ， 文 持 快速 中 断 啊 应 和 中 断 处理 优 先 级 动态 编程 ， 可 以 精确 定位 异 部 原因 和 类 型 。 同 
时 ，ARC 处 理 器 提供 了 丰富 的 调试 接口 和 调试 指令 ， 便 于 程序 员 实 时 监测 处 理 器 内 部 的 运行 状态 和 调试 应 用 程序 ， 使 得 ARC 处 理 器 可 以 
很 好 地 适用 于 可 靠 性 要 求 较 高 的 应 用 场合 。 


ARC 人 处理 器 的 研 友 经 历 了 ARCv1 和 ARCv2 两 种 指令 集体 系 结构 ， 得 到 了 元 分 的 市 场 验证 及 系统 应 用 。 目 前 ,全 球 已 有 超过 200 家 三 
商 获得 了 ARC 处 理 器 的 生产 授权 ， 基 于 ARC 处 理 器 的 心 片 年 出 货 量 超过 17 亿 片 。 


相 比 ARCv1，ARCv2 体 系 结构 在 以 下 万 面 进 一 步 提高 了 处 理 器 的 性 能 和 实时 处 理 能 

1) 支持 64 位 访 存 指令 。 

2) 支持 非 对 齐 的 存储 器 访 存 操作 。 

3) 支持 硬件 整数 除法 。 

4) 增加 了 684 位 乘法 、 乘 昧 加、 向 量 加 法 和 减法 等 指令 操作 。 

5) 支持 影子 寄存 器 以 进行 异常 处 理 中 的 现场 保护 ， 减 少 异常 上 下 文 的 切换 时 间 。 

6) 扩展 了 中 断 处 理 功能 ， 支 持 多 达 240 个 外 部 中 断 和 16 个 可 编程 中 断 优先 级 ， 可 自动 保存 上 下 文 和 返回 现场 。 
7) 优化 的 指令 集结 构 使 得 代码 密度 可 以 获得 18% 的 提升 。 


为 了 满足 府 入 式 领域 不 同 应 用 的 需求 ，ARC 处 理 器 已 经 开发 了 丰富 的 产品 系列 !1， 如 图 1-1 所 示 。 
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图 1-1 ARC 处 理 器 产品 系列 


1) HS 产品 系列 (HS34、HS36、HS38) 是 目前 性 能 最 高 的 ARC 处 理 器 内 核 ， 采 用 了 十 级 流水 线 技术 ， 支 持 指 令 乱 序 执 行 和 L2 
Cache， 可 配置 成 双核 或 四 核 SMP (Symmetric Multi-Processor， 对 称 多 处 理 器 ) 系统 ， 并 支持 运行 Linux 操 作 系 统 。 可 提供 高 达 
1.6GHz 的 主 频 和 1.9DMIPS/MHz 的 性 能 ， 内 核 功 耗 为 60mW， 面 积 约 0.15mm“<。HS 产 品系 列 主要 面向 高 端的 嵌入 式 应 用 ， 如 固态 硬 
盘 、 联 网 设备 、 汽 车 控制 器 、 媒 体 播放 器 、 数 字 电 视 、 机 顶 盒 和 家 庭 联 网 产品 等 。 

2) EM 系列 产品 (EM4、EM6、EM SEP, EM5D, EM7D) 是 功 耗 最 低 、 面 积 最 精简 的 ARC 处 理 器 内 核 ， 采 用 三 级 流水 线 技术 。 
可 提供 约 900M Hz 的 主 频 和 1.77DMIPS/MHz 的 性能， 能 耗 效 率 可 达 3W/MHz， 内 核 面 积 仅 为 0.01mm“。 主 要 面向 深 嵌 入 式 超 低 功 耗 
应 用 领域 以 及 数字 信和 号 处 理 领 域 ， 如 loT (Internet of Things， 物 联网 ) 、 工 业 微 控制 器 、 机 顶 盒 、 汽 车 电子 等 。 

3) 700 系 列 产 品 (710D, 725D, 770D) 采用 了 七 级 流水 线 技术 ， 支 持 动 态 分 支 了 预测， 可 提供 高 达 1.1GHz 的 主 频 。 主 要 面向 中 、 
高 端的 伐 入 式 应 用 领域 ， 如 固态 硬盘 、 图 像 处 理 、 信 号 处 理 、 联 网 设备 等 。 

4) 600 系 列 产 品 (601、605、610D、625D) 采用 了 五 级 流水 线 技 术 ， 可 提供 约 900MHz 的 主 频 。 主 要 面向 通用 误 入 式 领 域 ， 如 


工业 控制 、 带 宽 调 制 解 调 、VolP、 音 频 处 理 等 。 此 外 ，600 系 列 处 理 器 具备 特有 的 XY 存储 器 结构 ， 特 别针 对 数字 信号 处 理 进行 优化 ， 可 
以 很 好 地 应 用 于 嵌入 式 DSP (Digital Signal Processing) 领域 。 


5) AS200 系 列 产 品 (AS211SFX, AS221BD) 是 专门 用 于 数字 电视 、 数 码 相机 、 音 频 播 放 和 视频 播放 等 音频 处 理应 用 领域 。 


此 外 ， 为 了 能 更 有 效 地 针对 特定 应 用 进行 开 友 ， 降 低 设计 风 险 ， 缩 短 产 品 设计 周期 ， 基 于 ARC 处 理 器 的 软件 开 上 友 工 具 、 中 间 软 件 以 
及 操作 系统 部 署 等 也 都 趋 于 完善 和 成 熟 ， 建 立 了 完整 的 生态 系统 ， 能 够 给 工程 技术 人 员 提 供 一 套 完 整 的 解决 方案 。 


ARC 处 理 器 的 主要 特点 可 归纳 如 下 : 


1) 以 功 耗 效率 (DMIPS/mW) 和 面积 效率 (DMIPS/mm?) 最 优化 为 目标 ， 满 足 谨 入 式 市 场 对 微 处 理 器 产品 日 益 提高 的 效能 


2) 成 束 、 统 一 的 |SA 指 令 集体 系 结构 不 仅 便 于 开 友 不 同 产品 系列 ， 也 便于 开 友 同一 系列 下 的 不 同 产品 ， 具 有 非 单 好 的 延展 性 和 兼容 


3) 高 度 可 配置 性 ,以 便 “ 量 体裁 家 ”， 可 通过 增加 或 删除 功能 模块 ， 满 足 不 同 应 用 需求 ， 通 过 配置 不 同属 性 实现 快速 系统 集成 。 


~~ 


4) 灵活 的 可 扩展 性 ， 支 持 用 尸 目 定义 指令 、 外 围 接口 和 硬件 逻辑 ， 进 一 步 优化 处 理 器 性 能 和 功 耗 。 


~~ 


5) 强大 的 实时 处 理 能 力 ， 中 断 啊 应 快速 且 动 态 可 编程 。 


6) 优异 的 节能 特性 ， 支 持 从 体系 结构 (SLEEPS) 、 硬 件 设计 ( 门 探 时 钟 ) 到 设计 实现 〈 门 级 功 耗 优化 ) 等 不 同 粒 度 的 低 功 耗 
控制 。 


7) 丰富 的 调试 功能 ， 协 助 编程 人 员 快 速 但 询 处 理 器 状态 。 
8) 成 熟 的 开 友 套件 和 完整 的 生态 系统 ， 帮 助 工程 设计 人 员 快 速 完成 从 严 品 设计 、 实 现 到 验证 等 嵌入 式 开 友 过 程 。 


[1] 本 章节 所 涉及 的 处 理 器 频率 、 功 耗 和 面积 数据 均 基 于 TSMC 28nm HPM 工 艺 。 


1.3 ARC EMANE AA] 


ARC EM 处 理 器 产品 系列 自 2012 年 推 向 市 场 以 来 ， 已 经 在 传感器 、1oT、 微 控制 器 、 数 字 信 和 号 处 理 以 及 汽车 电子 等 对 设备 功 耗 、 体 
积 和 安全 性 要 求 高 的 深 吝 入 式 应 用 领域 得 到 了 广泛 应 用 。 


ARC EM 处 理 器 的 通用 结构 及 其 系列 产品 如 图 1-2 所 示 。ARC EM 处 理 器 及 用 了 三 级 流水 线 拷 术 ， 包 含 基本 的 取 指 部 件 、ALU (算术 
逻辑 单元 ) 和 寄存 器 组 。 在 此 基础 之 上 ， 通 过 添加 不 同 的 功能 模块 (如 高 速 缓存 Cache、 烷 耦合 存储 器 CCM) 或 扩展 指令 集 (如 向量 
处 理 DSP 指 令 ) 实现 不 同 的 产品 。 


interrupt 
Controller 


EMSEP |iso v = em TEES WOT 
EM5D ‘| Up to 2MB 1 & D CCMs, DSP 
EM7D |Upto 2MB 1 & D CCMs, | & D Caches (up to 32K), DSP 


图 1-2 ARC EM 处 理 器 通用 结构 与 系列 产品 


目前 ，ARC EM 处 理 器 产品 系列 主要 包括 以 下 几 种 : 


(1) ARC EM4 处 理 器 


ARC EM4 结 构图 如 图 1-3 所 示 。 


:内核 规模 非常 小 ， 等 效 门 数 小 于 10K。 


- 高 达 1.77 DMIPS/MHz 和 3.41 Core-Marks/MHz 的 性 能 


支持 多 达 16 个 中 断 优先 级 别 ，240 个 中 断 。 


` 可 配置 指令 CCM (ICCM) 容量 为 512B~2MB。 


- 可 配置 数据 CCM (DCCM) 容量 为 512B~2MB。 

- ARM、AMBA、AHB、AHB-lite 和 BVCI 总 线 接口 。 
. 可 选 32X32 或 (Fr) 16X16 乘 法 器 。 

- 支持 自 定义 用 户 扩 展 。 


主要 应 用 包括 : 府 入 式 和 深 蔡 入 式 应 用 ， 如 智能 微 系统 (智能 MEMS 系 统 ) 、 记 忆 卡 、SSD 控 制 器 、8 位 和 16 位 微 控 制 器 替代 产品 
和 电池 供电 的 产品 。 


(2) ARC EM6 处 理 器 


ARC EM6 结 构图 如 图 1-4 所 示 。ARC EM6 内 核 支 持 高 达 32K 的 指令 和 数据 高 速 缓存 ， 并 专门 进行 了 优化 ， 以 用 于 功 耗 和 成 本 敏感 型 
RIERA UKOR ERA AMH. 
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图 1-3 ARC EM4 结 构 
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图 1-4 ARC EM6 结 构 
- 多 达 32KB 指 令 高 速 缓存 (ICache) 。 

“ 多 达 32KB 数 据 高 速 缓存 (DCache) . 

- 高 达 1.77 DMIPS/MHz 和 3.41 Cote-Matks/MHz 的 性 能 。 

` 支持 多 达 16 个 中 断 优 先 级 别 ，240 个 中 断 。 

- 可 配置 指令 CCM (ICCM) 容量 为 512B~2MB。 

- 可 配置 数据 CCM (DCCM) 容量 为 512B~2MB。 


- ARM、AMBA、AHB、AHB-lite 和 BVCI 总 线 接口 。 


- 可 选 32X32 和 (或 ) 16X16 乘 法 器 。 


Optional 


支持 自 定义 用 户 扩展 。 
主要 应 用 包括 : 记忆 卡 、SSD 控 制 器 、 功 耗 管 理 产 品 、 便 携 式 媒 体 播放 器 和 其 他 移动 设备 。 
(3) ARC EM SEP 处 理 器 


ARC EM SEP 将 实现 汽车 安全 完整 性 等 级 ASIL D 的 硬件 安全 特性 与 高 效 小 型 处 理 器 相 集成 ， 其 结构 图 如 图 1-5 所 示 。 


DesignWare ARC EM SEP Core 
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DesignWare ARC FPX floating point extension 
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图 1-5 ARCEM SEPA 8 2545 


集成 满足 ASIL D 级 要 求 的 硬件 功能 ， 包 括 纠 错 码 (Error-Correcting Code, ECC) ， 支 持 校 验 位 ， 用 户 可 编程 的 看 门 狗 定时 器 和 双 


核心 的 同步 接口 。 
- MetaWare 编 译 器 已 通过 ASIL D 级 认证 。 
. 大 量 用 于 简化 ISO 26262 认 证 程序 的 安全 文件 。 


` 应 用 目标 包括 需要 ISO 26262 安 全 许可 的 谱 入 式 汽 车 应 用 ， 如 运动 与 加 速 传感器 、 电 动 助 力 转向 系统 和 先进 的 驾驶 辅助 系统 
(Advanced Driver Assistance System, ADAS) 。 


(4) ARC EM DSP 处 理 器 


物 联网 (loT) 市 场 中 可 穿戴 式 设备 及 器 件 需要 其 DSP 高 性 能 和 低 功 耗 ， 以 实现 最 佳 性 能 和 延长 系统 待机 时 | 间 ，ARC EM DSP 系 列 
(包括 EM5D 和 EM7D 处 理 器 ) 正 是 针对 低 功 耗 褒 入 陈 应 用 进行 了 优化 ， 其 结构 图 如 图 1-6 所 示 。 
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图 1-6 ARC EM5D4eEM7D AE 32 25 25 44 


- ARCv2DSP ISA 增 加 了 超过 100 条 DSP 指 令 。 

. 定点 、 秋 量 和 SIMD DSP 处 理 支 持 。 

- 高 能 效 的 统一 32X32 MUL/MAC 单 元 。 

` 高 度 可 配置 的 DSP 和 处 理 器 功能 ， 以 实现 最 佳 设 计 。 
: MetaWare C/C++ 编译 器 ， 支 持 DSP 编 程 。 

功能 丰富 的 DSP 软 件 库 ， 提 供 便捷 的 算法 编程 。 

可 选 的 硬件 除法 器 。 

高 达 1.77 DMIPS/MHz 和 3.41 CoreMatk/MHz 的 性 能 。 
| 支持 APEX 处 理 器 扩展 套件 的 加 速 。 


.JITAG 调 试 界面 。 


主要 应 用 包括 : 处 理 声 音 、 音 频 和 传感器 数据 的 超 低 功 耗 、 实 时 人 在线 的 loT 设 备 。 


1.4 ARC EM 处 理 器 开发 环境 


Synopsys 公 司 基 于 ARC EM 处 理 器 提供 了 RTL 人 代码 实现 、 软 件 编程 与 调试 以 及 硬件 FPGA 验 证 等 完整 的 开发 环境 。 


1.5 小结 


本 草 首 先 介绍 了 骨 入 式 系 统 的 基本 概念 、 主 要 结构 和 特点 ， 使 读者 对 藤 入 式 系 统 有 一 个 全 面 的 了 解 。 随 后 ， 针 对 藤 入 式 系 统 中 的 核 
心 硬件 组 成 一 一 微 处 理 器 ， 详 尽 介绍 了 Synopsys ARC 处 理 器 的 主要 特点 、 产 品系 询 及 其 相应 的 应 用 领域 。 最 后 ， 介 绍 了 ARC EM 处 理 
器 系列 的 开发 环境 。 


下 一 章 将 详细 讲述 ARC EM 处 理 器 的 特点 、 优 势 及 其 内 核 结构 ， 读 者 可 人 在 了 解 处 理 器 结构 特点 的 基础 上 ， 进 一 步 熟 悉 访 处 理 器 的 使 
Hi. 


第 2 章 ARC EM 处 理 器 介绍 


本 草 首 先 详细 介绍 ARC EM 处 理 器 的 特点 及 优势 。 其 次 ， 进 一 步 深 入 处 理 器 内 核 内 部 ， 介 绍 ARC EM 处 理 器 的 接口 信号 、 微 染 构 和 
流水 线 、 存 储 系统 ， 以 及 存储 保护 机 制 和 调试 拉 术 等 结构 方面 的 知识 。 


2.1 ARC EM 处 理 器 特点 


ARC EM 是 一 个 32 位 处 理 器 内 核 ， 采 用 三 级 流水 线 结构 ， 使 功 耗 效率 (DMIPS/mW) 及 面积 效率 (DMIPS/mm?) 都 达到 最 佳 
化 。 这 一 系列 处 理 器 是 ARC 中 功 耗 最 低 的 ， 同 时 其 可 配置 性 能 够 针对 性 能 和 功 耗 进行 优化 ， 定 制 指令 能 够 整合 专 有 硬件 以 及 广泛 的 生态 
系统 支持 。 


ARC EM 微 处 理 器 有 以 下 主要 特点 : 

C 支持 ARCv2 指 令 集 ， 能 混合 执行 16/32 位 指令 ， 能 最 优化 程序 代码 密度 。 

支持 用 户 模式 和 内 核 模式 。 

` 支持 最 多 64 个 寄存 器 ， 有 效 提升 执行 速度 和 优化 程序 大 小 。 

| 存储 器 寻 址 方式 灵活 简单 ， 执 行 效率 高 。 

- 支持 最 多 240 个 外 部 中 断 和 16 个 优先 级 ， 支 持 快速 中 断 和 寄存 器 文件 组 自动 切换 。 
| 支持 指令 和 数据 高 速 缓存 。 


.支持 指令 和 数据 紧 窗 耦合 存储 器 (CCM) 。 


` 丰富 的 可 配置 性 。 
` 强大 的 用 户 扩展 性 。 


-高效 的 低 功 耗 机 制 ， 由 结构 级 的 门 控 时 钟 : 在 正 第 运行 时 ，EM 处 理 器 会 自动 关闭 没有 使 用 的 模块 时 钟 ; @ 多 种 低 功 耗 模式 : 
SLEEP 指令 可 使 处 理 器 进入 不 同等 级 的 低 功 耗 模式 ， 包 括 乡 种 关闭 时 钟 和 关闭 电源 的 模式 ; (3) 支 持 动态 的 电压 频率 调整 。 


如 图 2-1 所 示 为 ARC EM 系列 处 理 器 与 同类 型 某 系列 处 理 器 的 功能 对 比 。 


从 图 2-1 可 以 看 出 ，ARC EM 在 同样 的 三 级 流水 线 内 核 下 ， 其 处 理性 能 能 够 达到 1.77DM1IPS/MHz。ARC EM 能 够 通过 灵活 的 可 配置 
性 ， 履 盖 某 处 理 器 整个 系列 的 功能 ， 并 提供 了 某 处 理 器 系列 中 不 具备 的 快速 的 上 下 文 切换 、I/D 高 速 缓 人 在 和 紧密 耦合 的 寄存 器 组 件 。 这 
种 丰富 、 灵 活 的 架构 使 得 ARC EM 系列 处 理 器 能 够 针对 不 同 的 应 用 需求 有 不 同 的 功能 表现 。ARC EM 处 理 器 在 与 竞争 对 手 的 性 能 、 功 耗 
和 面积 (Performance, Power&Area) 比较 中 也 处 于 领先 地 位 。 


配置 选项 
:快速 的 上 下 文 切 换 
-指令 /数据 高 速 缓存 
“ 紧 耦 合 的 寄存 器 组 件 ARCv2EM 特 性 
:小 型 实时 跟踪 


单个 内 核 。 多 个 配置 选项 
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图 2-1 ARC EM 处 理 器 与 同类 某 处 理 器 功能 对 比 
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Power(uW/MHz) 


图 2-2 ARC EM 处 理 器 与 其 他 处 理 器 的 能 耗 对 比 图 


从 图 2-2 中 可 以 看 出 ，ARC EM 的 同等 配置 的 EM4 内 核 在 面积 和 功 耗 上 和 处 理 器 CC 近似。 由 于 EM 更 加 合理 的 流水 线 设 计 ， 使 得 其 最 
高 频率 更 高 ， 此 外 指令 集 和 体系 结构 的 优势 使 得 EM 的 最 高 性 能 远 远 高 于 处 理 器 C 以 及 其 他 葛 争 产品 。EM5D 包 含 丰 富 的 DSP 捐 令 ， 适 合 
物 联 网 设备 中 的 传感器 算法 和 音频 算法 应 用 。 


下 面 针 对 ARC EM 处 理 器 独特 的 可 配置 性 和 用 户 扩展 性 做 简单 介绍 ， 在 第 10 章 及 第 11 章 将 详细 介绍 。 


2.2 ”可 配置 性 及 可 扩展 性 


2.2.1 可 配置 性 


ARC EM 系列 的 可 配置 性 针对 不 同 的 应 用 需要 有 不 同 的 功能 需求 。 固 定 功能 的 心 片 结构 或 许可 以 面面俱到 ， 但 是 在 将 其 设计 投入 产 
品 之 后 ， 某 学 部 分 的 功能 可 能 完全 没有 使 用 到 的 机 会 ， 但 即使 没有 使 用 ， 开 妈 商 仍 需 文 付 这 举 “ 多 余 ” 部 分 的 成 本 ， 这 融 造 成 了 滔 费 。 
与 之 相对 应 的 ，ARC EM 可 根据 应 用 “ 量 身 勇 裁 ”， 提 供 更 加 节 镍 换 源 的 解决 方案 。ARC EM 既 文 持 对 可 选择 功能 部 件 进 行 可 配置 ， 还 
又 持 对 相关 功能 部 件 的 属性 参数 根据 应 用 需求 进行 配置 。ARC EM 的 可 配置 性 具体 如 下 。 


| 处 理 器 基本 配置 : 地 址 总 线 宽 度 、 程 序 指 针 PC 宽 度 、 循 环 计数 器 宽度 、 复 位 暂停 、 大 小 端 、 中 断 向 量 表 复 位 基地 址 。 
“ 寄存 器 配置 : 寄存 器 数量 、 写 口 数量 、 寄 存 器 组 (Bak) 以 及 备份 组 中 寄存 器 数量 。 

:总线 接 口 协议 : 根据 应 用 需求 ，ARC EM 可 进行 4 种 总 线 接口 的 配置 (BVCI 和 不 同 版 本 的 AHB) o 

PB: 可 对 处 理 器 内 核 可 获取 的 中 断 个 数 以 及 外 部 中 断 管 脚 、 中 断 优 先 级 以 及 快速 中 断 等 进行 配置 。 

Cache 或 外 存 访 问 主 端 : 处 理 器 可 以 通过 Cache 或 者 外 存 接口 主 端 访问 外 存 ， 并 可 对 Cache 大 小 、 关 联 度 等 参数 进行 配置 。 


. CCM: 紧 耦 合 存储 器 可 配置 大 小 和 从 端 访 问 接 口 。 


. JTAG O: 支持 2 线 和 4 线 JTIAG 协 议 ， 能 够 访问 所 有 内 核资 源 。 其 中 ，2 线 JTIAG 是 一 个 可 选 的 接口 组 件 ， 作 为 标准 的 4 线 JTAG 的 
补充 。 
: Debug 接口: 外 部 主机 (或 调试 器 ) 使 用 调试 端口 接口 访问 处 理 器 资源 ， 包 括 内 部 寄存 器 和 整个 存储 器 空间 。 在 实际 设计 中 ， 婚 
可 以 从 JTAG 调 会 端口 进行 访问 ， 也 可 以 只 是 连接 到 仿真 模型 进行 验证 (使 用 -fast_rascal 选 项 ) o 


- 定时 器 : Timet0、Timet1 及 RTC (Real-Time Counter) 计数 器 都 可 以 根据 需要 进行 配置 。 


. 其 他 : 还 可 以 根据 应 用 需要 ， 配 置 以 下 特性 ， 代 码 保 护 、 挫 栈 保护 、 存 储 保护 MPU、 实 时 程序 追踪 、 硬 件 断 点 和 观察 点 、 性 能 监 
视 器 、 看 门 狗 定时 器 、 存 储 器 错误 保护 、DSP 指 令 支 持 、FPU 指 令 支 持 、 用 户 AUX 接 口 等 。 


在 标准 指令 集 基础 上 ，ARC EM 还 提供 6 组 可 选 的 指令 集 包 给 用 户 ， 用 户 可 根据 应 用 需求 来 进行 配置 。ARC EM 处 理 器 提供 了 一 套 

完整 的 流程 用 来 配置 指令 集 ， 从 而 能 够 在 性 能 、 复 杂 性 、 工 作 频 率 、 能 耗 间 达到 适当 的 平衡 。ARC EM 系列 还 包含 了 大 量 的 配置 检查 功 
能 以 及 工具 链 ， 程 序 库 支持 ， 能 即时 反馈 ， 加 快 和 优化 处 理 器 配置 。 表 2-1 总 结 了 ARC EM 指令 集 支持 的 可 配置 选项 。 详 细 的 指令 集 介 
绍 参 见 第 3 草 。 关 于 使 用 工具 对 ARC 处 理 器 进行 配置 ， 及 配置 过 程 对 软件 开 友 的 影响 等 内 容 ， 参 见 第 10 章 。 


表 2-1 ARC EM 处 理 器 指令 集 的 可 配置 选项 


ISA 扩展 包 LEE 附加 说 明 额外 辅助 寄存 器 


SELEO, SETNE, SETLT, SETGE, SETEO, 


SETHS,SETLE, SETGT = 
ENTER 5, LEAVE, 5, BI, BIH 


JLI S JLI BASE 
CODE DENSITY OPTION LDI, LDI S LDI BASE 
| 


EI S EI BASE 


LD S R0-3,[h,u5] 
LD S.AS a,[b,c] 
LD S RI,[GP, s11] 


ST S R0,[GPs11] 
[°° 
NORM, NORMH, FFS, FLS 一 


SWAP OPTION 
EET E ASRI6, ASR8, LSR8, LSL8, ROL8, ROR8 


多 位 移 位 或 旋转 操作 : ASL, LSR, ASR, ROR, ASL S, 
SHIFT OPTION LSR S, ASR S 


ASRI6, ASR8, LSR8, LSL8, ROL8, ROR8 
3 多 位 移 位 或 旋转 操作 : ASL, LSR, ASR, ROR, ASL S, 


LSR S, ASR S 


MPY OPTION 


] 


一 | srAr-Usa2 
DIV, DIVU, REM, REMU 中 的 DZ 位 


DIV REM OPTION 


2.3 ARC EM 处 理 器 结构 


ARC EM 的 设计 采取 了 在 保证 面积 小 的 前 提 下 最 大 可 能 地 提高 性 能 的 结构 ， 其 处 理 器 结构 非常 精简 ， 使 得 ARC EM 的 内 核 非常 小 ， 
器 件 的 功 耗 也 随 之 降低 。 


本 书 主要 介绍 ARC EM 微 处 理 器 的 接口 信号 、 内 核 结构 、 存 储 系统 、 存 储 保护 机 制 以 及 调试 。 


24 人 小结 


本 章 主 要 介绍 了 ARC EM 处 理 器 的 特点 、 优 势 及 其 体系 结构 ， 其 中 详细 介绍 了 ARC EM 处 理 器 的 接口 和 存储 系统 ， 并 重点 介绍 了 其 
可 配置 性 和 可 扩展 性 ， 有 助 于 用 户 了 解 处 理 器 结构 特点 ， 从 而 进一步 熟悉 该 处 理 器 的 使 用 。 


下 一 章 将 详细 介绍 ARC EM 处 理 器 编程 模型 的 基本 工作 原理 、 指 令 集 及 其 编程 的 数据 类 型 和 指令 格式 。 


Bom ARC EM 编程 模型 


本 章 介 绍 ARC EM 处 理 器 的 编程 模型 ， 主 要 包括 : 寻 址 空间 划分 、 数 据 类 型 、 寻 址 方式 、 宵 和 存 器 组 、 工 作 模 式 以 及 指令 操作 类 型 和 
格式 等 。 通 过 本 章 的 学 习 ， 能 够 帮助 读者 详细 了 解 ARC EM ， 以 便 更 好 地 基于 ARC EM 进行 从 入 式 系 统 的 开发 。 


3.1 概述 


ARC EM 处 理 器 基于 ARCv2 ISA (Instruction-Set Architecture， 指 令 集 体系 结构 ) 设计 。ARCv2 ISA 虽 在 提供 精简 高 性 能 的 指令 
编码 ， 同 时 也 包含 大 量 的 操作 码 空 间 用 于 扩展 指令 。 


与 其 他 RISC 结 构 微 处 理 器 类 似 ，ARCv2 1SA 基 于 通用 寄存 器 实现 ， 数 据 处 理 指令 只 对 寄存 器 进行 操作 ， 通 过 加 载 (Load) /存储 
(Store) 指令 访问 存储 器 ,支持 两 个 源 操作 数 和 一 个 目的 操作 数 的 指令 格式 。 指 令 宽度 包含 16 位 和 32 位 两 种 ， 两 者 之 间 可 以 无 颖 连 
接 ， 无 需 通 过 状态 切换 机 制 来 选择 处 理 器 及 用 的 指令 解析 钦 辑 。 与 其 他 RISC 结 构 微 处 理 器 不 同 的 是 ，ARC 人 处理 器 中 的 控制 寄存 器 及 状态 


寄存 器 映射 成 单独 的 辅助 宵 存 器 (Auxiliary Register) 空间 ， 通 过 ARCv2 1SA 中 特殊 的 访 存 指令 LR/SR 进 行 访 问 。 
ARCv2 1SA 的 主要 特点 如 下 。 
1. 指 令 


. 无 颖 连接 的 16 位 和 32 位 指令 


. 处 理 器 工作 在 用 户 模式 与 内 核 模式 两 种 工作 模式 


2. 寄 仔 器 


ais 


通用 核心 寄存 器 组 


专用 辅助 寄存 器 组 


. 寻 址 模式 


“ 地 址 寄存 器 回 写 模式 


- 前 置 和 后 置地 址 寄存 器 回 写 模式 


: 支持 堆栈 指针 模式 
- 可 缩放 数据 宽度 (Scaled Data Size) 寻 址 模式 
: PC 相对 寻 址 模式 
4. 程 序 流 
“支持 条 件 执行 的 ALU (Arithmetic Logical Unit, RZF) 指令 
. 单 周期 立即 数 访问 
- 带 单 指令 延迟 构 的 跳 转 和 分 支 
:比较 与 分 支 组 合 指令 
AER DUE X 
- SE LE 
5. 中 断 和 异常 
. 动态 分 配 的 中 断 优先 级 
` 不 可 屏蔽 异常 
可 屏蔽 外 部 中 断 
精确 异常 


“ 存储 访问 ， 指 令 和 特权 异 第 


6. 指 令 条 展 包 
+ 代码 密度 选项 
- 位 操作 和 规范 化 
: 字 节 级 的 移 位 、 旋 转 和 字 节 顺序 重 排 


低 开销 的 字 节 和 半 字 (16 位 ) 移 位 和 旋转 


7. 多 处 理 器 支持 


EDI 
: LLOCK-SCOND48 & 
8 .调试 特性 
. 通过 特殊 寄存 器 启动 、 停 止 和 单 步调 试 处 理 器 


` 通过 处 理 器 调试 接口 全 面 监视 处 理 器 状态 


9. 电 源 管 理 
. 休眠 指令 
10. 处 理 器 定时 器 
2 个 32 位 可 编程 定时 器 


` 1 个 64 位 实时 计数 器 (RTC) 


3.2 


圳 分 


如 图 3-1 所 示 ，ARCv2 1SA 中 定义 了 3 个 32 位 地 址 空间 。 
. 4 GB 指令 地 址 空间 。 
: 4 GB 可 寻 址 数据 地 址 空间 。 


- 32 位 辅助 寄存 器 地 址 空间 。 此 地 址 空间 提供 了 额外 4GB 地 址 空间 ， 包 括 处 理 器 的 控制 和 状态 寄存 器 、LI/O 设 备 、BCR (Build 


Configuration Register) 配置 寄存 器 以 及 用 户 专 用 扩展 寄存 器 等 ， 通 过 LR 和 SR 指令 进行 访问 。 


0 0 


代码 空间 数据 和 IO 外 部 数据 和 LO 


可 通过 取 指 或 
PC 相对 寻 址 
操作 访问 


操作 访问 


可 通过 LR/SR 等 
操作 访问 


4GB 4GB 4GW 


图 3-1 地址 空间 模型 


基于 ARCv2 1SA 设 计 的 ARC 处 理 器 ， 采 用 物理 上 独立 的 指令 与 数据 通道 ， 既 可 以 实现 为 冯 ' 诺 依 曼 结构 ， 也 可 以 实现 为 哈佛 结构 。 在 
默认 配置 下，ARC 处 理 器 使 用 统一 的 4GB 数 据 和 指令 存储 空间 ， 如 图 3-2 所 示 。 


0 


外 部 数据 和 I/O 


人 代码、 数据 和 
LO 空间 


可 过 过 LR/SR 
操作 访问 


可 通过 取 指 、 
PC 相对 寻 址 、 


4GB 4GW 


图 3-2 ”统一 的 地 址 空间 模型 


3.3 ”数据 类 型 


ARCv2 ISA 中 每 个 字 (Word) 单元 包含 4 个 字 节 (Byte) 单元 或 者 两 个 半 字 (Half-Word) 单元 ;1 个 半 字 蛙 元 中 包含 两 个 字 市 蛙 
元 。 但 是 在 字 单 元 中 ，4 个 字 节 哪 一 个 是 高 位 字 节 ， 哪 一 个 是 低位 字 节 ， 衣 入 陈 系统 中 弟 用 两 种 不 同 的 格式 : Nm. (Little- 


endian) 和 大 端 格式 (Big-endian) 。 


小 油 格 式 是 指 字 数据 的 高 字 书 放置 在 高 地 址 中 ， 而 低 字 节 数 据 放 置 在 低地 址 中 。 大 端 格 式 是 指 字 数据 的 高 字 证 放置 在 低地 址 中 ， 而 
低 字 节 数 据 放 置 在 高 地 址 中 。 


ARCv2 ISA 支 持 大 新 格 式 和 小 端 格 式 两 种 数据 存储 ， 在 默认 配置 下 ， 数 据 存储 格式 是 小 端 格式 ， 用 尸 也 可 根据 应 用 配置 成 大 端 格 
Ze 


ARCv2 1SA 支 持 的 数据 类 型 包括 : 32 位 (Word, F) 、16 位 (Half-word, +=) 、8 位 (Byte, #1) 以 及 1 位 (bit) . 


34 寻 址 方式 


ARCv2 ISA 支 持 6 种 基本 寻 址 模式 ， 如 表 3-1 所 示 。 


表 3-1 ARCv2 ISA 的 6 种 基本 寻 址 模式 


E È Ho 


寄存 器 直接 寻 址 对 存储 在 寄存 需 中 的 值 执行 操作 
寄存 需 间 接 寻 址 以 寄存 需 的 内 容 为 地 址 ， 对 该 地 址 指 回 的 单元 内 容 值 执行 操作 


以 寄存 各 的 内 容 为 基地 址 ， 加 上 仿 移 量 计 算 地 址 ， 对 该 地 址 指 问 的 单元 内 
容 值 执行 操作 


立即 寻 址 对 指令 操作 码 中 的 当量 数据 进行 操作 


Ar EE n 8] P2 S f Eo IHE 


以 程序 计数 器 PC 的 当前 值 为 基地 址 、 指 令 操 作 码 中 的 地 址 为 偏 移 量 计算 
地 址 ， 对 该 地 址 指 回 的 单元 内 容 值 执行 操作 


绝对 寻 址 对 操作 码 中 第 量 指定 的 固定 地 址 指 回 的 单元 内 容 信 执 行 操 作 


PC 相对 寻 址 


3.5 ” 寄 仔 器 组 


ARCv2 ISA 中 ， 寡 存 器 组 主要 包括 核心 寄存 器 组 (Core Register Set) 和 辅助 寄存 器 组 (Auxiliary Register Set) 。 在 核心 寄存 器 
组 中 ， 程 序 员 可 以 使 用 通用 寄存 器 (r0~r28、r30 和 r31) 作 任 意 编程 用 途 ， 此 外 该 组 中 还 定义 了 一 些 特殊 用 途 的 寄存 器 ， 如 堆栈 指针 、 
链 授 寄存 器 和 循环 计数 器 等 。 辅 助 寄存 器 组 包含 状 态 寄存 器 和 控制 寄存 器 ， 通 过 特殊 的 访 存 措 令 (LR/SR) 访问 独立 的 辅助 寄存 器 地 址 
空间 。 


3.6 ”工作 模式 


ARCv2 1SA 支 持 处 理 器 工作 在 两 种 模式 下 : 


1) 内 核 模式 (Kernel Mode) 。 拥 有 最 高 访问 权限 ， 可 以 访问 处 理 器 中 所 有 的 状态 ， 包 括 执 行 特权 指令 和 访问 特权 寄存 器 。 处 理 
器 复位 后 默认 进入 内 核 模式 。 


2) APIRIL (User Mode) 。 拥 有 最 低 访问 权限 ， 只 能 访问 处 理 器 中 有 限 的 状态 。 对 特权 状态 的 访问 将 报告 异 弟 。 


内 核 模式 和 用 户 模式 是 可 以 相互 切换 的 ， 任 何 异常 或 中 断 会 将 处 理 器 从 用 户 模式 切换 到 内 核 模式 ， 而 RTIE 指 令 则 可 以 将 处 理 器 从 内 
核 模式 切换 到 用 尸 模式 。 


3.7 ”指令 类 型 


ARCv2 ISA 中 支持 的 指令 类 型 可 以 分 为 5 种 : 算术 逻辑 运算 指令 、 数 据 传输 指令 、 控 制 流 指令 、 特 殊 措 令 和 扩展 指令 。 


38 指令 格式 


38.1 32fujgES x 


ARCv2 SA 指令 提供 元 整 的 32 位 编码 指令 格式 。 寄 存 器 - 寄存 器 型 指令 通常 及 用 3 个 独立 的 寄存 器 操作 数 ， 即 两 个 源 操作 数 和 一 个 
目的 操作 数 ， 第 二 个 源 操作 数 可 以 被 指定 为 一 个 短 立 即 数 ， 包 含 在 每 个 32 位 的 指令 里 。 


当 需 要 一 个 32 位 长 的 立即 操作 数 时 ， 应 在 源 寄 仔 器 r62 里 指明 ， 访 指令 要 求 32 位 立即 操作 数 在 连续 4 个 字 节 地 址 内 存 中 。 寄 仔 器 r63 
是 一 个 只 读 寄 存 器 ， 包 仿 32 位 字 对 齐 的 PC， 用 于 所 有 的 指令 产 操作 数 ， 从 而 支持 PC 相对 寻 址 。 


3.9” 措 令 集 应 用 实例 


ARCv2 ISA 使 用 特定 后 缀 语法 来 区 分 32 位 和 16 位 的 撒 令 ， 如 表 3-33 所 示 。 


表 3-33 ”32 位 和 16 位 指令 特定 后 级 语法 


OP 32 位 指令 


ARCv2 ISA 所 支持 的 所 有 32 位 和 16 位 指令 参见 附录 B。 
为 了 支持 不 同 寻 址 方式 、 不 同 的 条 件 执行 以 及 不 同 的 立即 数 大 小 ，ARCv2 1SA 中 使 用 了 助 记 符 ， 如 表 3-34 所 示 。 


表 3-34 ARCv2 ISA 指 令 助 记 符 列表 


a 
SH 
Ai 
it 
SE 


a, b, c Al FH fas 

h, g WHATA, MF 16 位 指令 ， 使 得 该 16 MAUAO R A ETE Ra E] 
u<X> Jof WANE, (GE <X> 位， 如 u6、u7 
s<X> 有 符号 立即 数 ， 位 宽 <X> 位 ， 如 s12、s13 
limm 32 位 长 立即 数 (一 般 作 为 第 二 个 操作 数 存 储 ) 
<i> 回 写 到 状态 寄存 器 标志 

«cc» 条 件 人 码 字 段 (例如 ， 条 件 分 支 ) 

«d» AES SATE (用 于 分 支 和 跳 转 ) 

«ZZ» 数据 大 小 定义 〈( 字 节 、 半 字 或 字 ) 

o 执行 符号 扩展 

<.di> 数据 缓存 劳 路 (加 载 和 存储 操作 ) 

<.aa> 地 址 与 回 

«y» BFE ERA BAS AP Sz TUI 


本 节 将 针对 ARCV2 ISA 支 持 的 不 同 指令 类 型 ， 列 举 部 分 具有 代表 性 的 指令 使 用 实例 。 


3.10 JA 
本 章 介 绍 了 ARC EM 处 理 器 的 编程 模型 ， 主 要 包括 ; 寻 址 空间 划分 、 数 据 类 型 、 寻 址 方式 、 寄 存 器 组 、 工 作 模式 以 及 指令 操作 类 型 
和 指令 格式 等 ， 并 详细 介绍 了 典型 的 常用 指令 ， 


下 一 章 将 介绍 ARC EM 处 理 器 的 中 断 和 异常 处 理 机 制 。 


第 4 章 ” 中 断 及 异 昔 处 理 


中 断 机 制 是 戏 入 式 系统 中 必 不 可 少 的 一 部 分 ， 特 别 是 在 低 功 耗 MCU 中 ， 中 断 更 是 扮演 了 特殊 角色 。 所 以 ， 深 入 学 习 并 掌握 中 断 技 
术 是 非常 重要 的 。 中 断 和 异常 都 是 处 理 系 统 中 突 友 事件 的 机 制 ， 即 请 求 处 理 器 打 断 正常 的 程序 执行 流程 ， 进 入 特定 的 处 理 或 服务 程序 中 
执行 。 本 章 主 要 介绍 ARC EM 处 理 器 的 中 断 和 异常 处 理 机 制 |。 


4.1 概述 


ARC EM 处 理 器 支持 异常 ， 并 且 可 选择 性 地 配置 中 断 。 由 于 异常 是 在 处 理 器 内 核 完成 某 个 指令 后 立即 触 友 ， 所 以 认为 它 是 同步 的 。 


而 中 断 在 处 理 器 运行 的 任何 时 刻 都 可 能 会 触 友 ， 所 以 认为 它 是 异步 的 。 


当 异 常 或 者 中 断 友 生 时 ，ARC EM 处 理 器 先 保存 当前 的 处 理 器 工作 模式 状态 信息 ， 随 后 切换 到 内 核 模 式 进行 异常 或 者 中 断 的 处 理 。 
当 退 出 异 弟 或 中 断 服务 程序 时 ，ARC EM 人 处理 器 硬件 根据 保存 的 工作 模式 状态 信息 上 自动 切换 到 之 前 的 工作 模式 继续 执行 。ARC EM 处 理 
器 也 支持 在 异常 或 中 断 服务 程 序 中 显 式 地 更 改 工作 模式 状态 信息 ， 以 便 在 退出 服务 程序 时 切换 到 所 期 望 的 工作 模式 。 


4.2 工作 模式 和 权限 


ARC EM 处 理 器 的 工作 模式 决定 是 否 允 许 任务 执行 某 一 特权 指令 或 访问 受 保 护 的 状态 。 例 如 ， 存 储 管理 系统 可 以 根据 当前 处 理 器 所 
处 的 工作 模式 来 判断 对 某 一 特定 存储 区 域 的 访问 是 否 合 法 。 


ARC EM 处 理 器 有 两 种 工作 模式 : 内 核 模式 和 用 户 模 式 。 这 两 种 工作 蛋 式 的 权限 等 级 不 同 。 


1) 内 核 模 式 具有 最 高 权限 等 级 ， 且 是 一 种 从 复位 进入 的 工作 模式 。 访 问 完整 的 处 理 器 状态 只 能 在 内 核 模 式 下 进行 ， 包 括 执 行 特权 
指令 和 访问 特权 寄存 器 。 内 核 模 式 任务 通过 STATUS32 寄 存 器 中 的 U 域 确定 处 理 器 所 处 的 工作 模式 及 恢复 所 有 合法 的 中 断 或 异常 的 状 
态 ， 而 且 可 使 完整 的 处 理 器 状态 得 以 保存 和 恢复 。 


2) 用 户 模 陈 是 最 低 权限 等 级 ， 对 于 访问 特权 处 理 器 状态 有 严格 限制 。 任 何 试 图 访问 特权 处 理 器 状态 或 执行 特权 的 指令 都 将 引 友 异 


FB 


ARC EM 处 理 器 在 用 户 模式 和 内 核 模 式 时 的 权限 区 别 如 表 4-1 所 示 。 


RAL 内 核 模 式 和 用 户 模式 的 权限 区 别 


访问 通用 寄存 大 除 ILINK ^n] p 允许 
内 存 管 理 /TLB 控制 AN 
缓存 管理 fcil 

普通 指令 fei 
特权 指令 iA 
€——À 只 允许 访问 LP START, LP END, PC32 以 及 STATUS32 "m 
UJ; [n] SEAS AD) ay FF A Pe action 域 fei] 
访问 外 部 辅助 寄存 大 fti 
访问 BCR 寄存 需 AA 
VIJENT at iA 
运行 TRAP Sn, SWI, SWI S 等 指令 人 允许 人 允许 
启用 中 断 ， 优 先 级 选择 允许 
扩展 指令 及 状态 当 相 应 XPU 寄存 大 中 位 域 使 能 时 人 允许 


1. 特 权 指 令 


特权 指令 包括 : 


: SLEEP 


: RTIE 
: CLRI 
: SETI 
"4DEBUG[UB] = 0 时 ， 以 下 指令 也 属于 特权 指令 : 
: BRK 
: BRK_S 


需要 指出 的 是 ，KFLAG 指 令 虽 然 不 属于 特权 指令 ， 但 是 在 内 核 模式 中 执行 该 指令 可 以 更 改 STATUS32 状 态 寄存 器 中 的 菏 些 特权 位 域 
值 


2. 特 权 寄 存 器 


绝 大 多 数 核 心 寄存 器 组 的 寄存 器 允许 在 用 尸 模式 和 内 核 模 式 两 种 工作 模式 下 访问 。ILINK 寄 存 器 则 只 人 允许 在 内 核 模式 下 访问 。 用 户 
模式 下 访问 ILINK 寄 存 器 将 引起 特权 违背 异 弟 ， 并 反映 在 异常 原因 寄存 器 中 。 


对 于 辅助 寄存 器 空间 ， 用 户 模 式 下 只 人 允许 访问 以 下 家 存 器 : 
PC (程序 计数 器 ) 
- STATUS32 (状态 寄存 器 ) 的 ZNCV 域 
: LP. START 
: LP. END 
除 上 述 之 外 的 辅助 寄存 器 只 能 在 内 核 模式 下 访问 。 
3. 工 作 模 式 切 换 
当 ARC EM 处 理 器 执行 下 列 指令 或 发 生 下 列 情况 时 ， 处 理 器 将 进入 内 核 模 式 : 
- 陷阱 (TRAP S) 、 软 中 断 (SWI, SWI_S) 
-中断 
异常 
` 复位 或 机 器 检测 异常 
而 当 以 下 情况 出 现时 ，ARC EM 处 理 器 将 从 内 核 模 式 切 换 至 用 户 模式 : 
- 从 异常 返回 一 一 处 理 器 状态 寄存 器 指出 最 后 一 个 异常 发 生 于 用 户 模式 。 
- 从 中 断 返 回 一 一 处 理 器 状态 寄存 器 指出 最 外 层 中 断 发 生 于 用 户 模 式 。 


在 状态 寄存 器 中 清除 中 断 有 效 位 或 异常 有 效 位 期 间 ， 异 常 和 中 断 处 理 程序 可 以 选择 在 返回 值 寄存 器 (ERET、ILINK、BLINK 等 ) 、 
状态 寄存 器 (ERSTATUS、STATUS32 PO) 及 活跃 中 断 寄存 器 AUX IRQ ACT 中 调整 数值 ， 以 跳 转 进入 内 核 模 式 或 用 户 模式 .。 


FLAG 指 令 不 能 用 于 改变 处 理 器 的 用 户 模式 或 内 核 模式 状态 ， 但 KFLAG 指 令 可 以 将 处 理 器 置 于 异常 处 理 模式 或 正常 模式 ， 还 可 用 于 


设置 中 断 闻 值 。 


4.3 ”中断 


中 断 是 指 处 理 器 在 正常 运行 程序 时 ， 由 于 内 部 或 外 部 事件 引起 处 理 器 暂时 中 止 执行 现行 程序 ， 转 去 执行 请 求 处 理 器 为 其 服务 的 那个 
外 设 或 事件 的 服务 程序 ， 答 该 服务 程序 执行 完 后 ， 又 返回 到 被 中 止 的 程序 中 执行 。 


当 处 理 器 检测 到 某 个 中 断 信号 后 ， 会 停止 当前 运行 程序 ， 并 保 仓 相 天 寄 仔 器 内 容 后 ， 才 跳 转 到 另 一 个 程序 的 地 址 开始 执行 指令 ， 这 
个 地 址 称 为 中 断 向 量 。 中 断 向 量 所 指向 的 程序 空间 称 为 中 断 服 务 程序 。 不 同 中 断 友 生 时 ， 处 理 器 内 核 跳 转 地 址 组 成 的 集合 称 为 中 断 同 量 
表 ， 它 指定 了 各 异 弟 中 断 及 其 中 断 服务 程序 的 对 应 关系 。 辣 量 表 中 每 个 中 断 或 异常 对 应 一 个 32 位 入 口 点 地 址 ， 并 且 可 以 通过 中 断 或 异 瘦 
向 量 号 进行 索引 查询 。 当 执行 完 中 断 服 务 程序 后 ， 处 理 器 会 恢复 中 断 友 生 时 相 天 寄存 器 的 内 容 ， 继 续 执 行 原来 的 程序 ， 整 个 过 程 称 为 中 
BT STRE, 


ARC EM 处 理 器 的 中 断 单 元 具有 民 好 的 可 编程 性 ， 可 处 理 以 下 中 断 类 型 。 
“ 定时 器 中 断 : 在 配置 了 相应 定时 器 的 CONTROL 寄 存 器 之 后 ， 由 定时 器 0 或 者 定时 器 1 在 计数 到 达 设 定 值 时 所 触发 的 中 断 。 
- 外 部 中 断 : 由 外 部 系统 触发 的 中 断 。 


软件 触发 中 断 : 由 软件 触发 的 中 断 ， 模 拟 外 部 硬件 行为 ， 可 用 于 调试 用 途 。 


44 异常 


当 正 常 的 程序 执行 流程 发 生 和 暂时 停止 时 ， 称 为 异常 。 一 旦 异常 友 生 ， 处 理 嚣 便 进 入 内 核 模式 ， 并 跳 转 到 向 量 表 中 的 某 个 入 口 。 


每 种 异常 对 应 于 一 个 优先 级 ， 如 果 同 时 友 生 两 个 或 更 多 异 弟 ， 那 么 将 按照 优先 级 的 固定 顺序 来 处 理 异 弟 。 


4.5 ”中 断 或 异 帅 服务 程序 返回 措 令 RTIE 


RTIE (return from interrupt or exception) 指令 用 于 从 中 断 或 异常 服务 的 程序 返回 ,还 允许 处 理 器 从 内 核 模式 切换 到 用 尸 模 
式 。RTIE 指 令 仅 在 内 核 模式 中 可 用 。 在 用 尸 模 式 下 使 用 此 指令 会 引 友 一 个 特权 违背 异 弟 。 


RTIE 指 令 可 恢复 之 前 的 上 下 文 现场 ， 包 括 : 程序 计数 器 、 状 态 寄存 器 、 通 用 寄存 器 等 ， 具 体 如 表 4-7 所 示 。RTIE 指 令 通 过 读 取 
STATUS32 寡 存 器 、AUX IRQ ACT 寄 存 器 以 及 IRQ PRIORITY PENDING 寄 存 器 的 相应 位 域 值 来 判断 进入 中 断 或 异常 之 前 的 处 理 器 机 器 
状态 ， 并 根据 中 断 或 异常 的 类 型 决定 如 何 恢复 。 


1) 如 果 是 从 异常 处 理 服务 程序 返回 ， 处 理 器 机 器 状态 通过 ERET、ERSTATUS 和 ERBTA 辅 助 寄存 器 恢复 。 
2) 如 果 是 从 快速 中 断 返 回 ， 处 理 器 机 器 状态 通过 |ILINK 和 STATUS32 P00 辅助 寄 存 器 恢复 。 


3) 如 果 是 从 常规 中 断 返 回 ， 处 理 器 机 器 状态 通过 用 尸 堆栈 或 内 核 堆 栈 (取决 于 进入 中 断 前 的 处 理 器 工作 模式 ) 恢复 。 同 时 ， 如 果 
AUX_IRQ_CTRL 寄 存 器 的 相应 位 有 效 ， 对 应 的 核心 寄存 器 和 辅助 寄存 器 也 将 从 堆栈 中 恢复 。 


c 


© 


快速 中 | uaa 


| ooon ooon ooon ooo RE 


RAT FPP OP BDIE AR A 


/ 
/ 
/ 
/ 
/ 
/ 


/ 


中 上 断 优先 级 
PO 退出 
HTL FER 
PO 退出 
PMT LICR 
P1 退出 
中 上 断 优 先 级 
P2 退出 
中 断 优先 级 
P3 退出 
HTL FER 
P4 退出 
中 上 断 优 先 级 
P5 退出 
"HIST TS 
P6 退出 
AT LICR 
P7 退出 
BTL FER 
P8 退出 


关联 寄存 器 
ERET, ERSTATUS, ERBTA 


ILINK, STATUS32 PO 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


从 堆栈 中 恢复 


(2E) 


wr. fy. 4 
xxxx xx10 0000 0000 / ISRP9 PTL FcR 从 堆栈 中 恢复 
P9 退出 
煌 优先 乡 
xxxx x100 0000 0000 / ISRP10 中 断 优先 ie 从 堆栈 中 恢复 
P10 退出 
er HP 2 
xxxx 1000 0000 0000 / ISRP11 T AA 从 堆栈 中 恢复 
P11 退出 
FEZ 
xxx1 0000 0000 0000 / ISRP12 TIBIA a 从 堆栈 中 恢复 
P12 退出 
DELZZIEBNEZE AE 


中 断 优先 级 -— 
E 从 堆栈 中 恢复 


退出 


0 XXXX XXXX XXXX XXX eee 7 De ERET、 ERSTATUS, ERBTA 
oe ONU 9 


ik: 表 4-7 中 ，x 表 示 非 关键 条 件 。x 值 的 位 表示 该 位 是 1 或 0， 它 不 影响 处 理 器 的 当前 操作 中 断 优 先 级 。1SR 是 中 断 服务 程序 ， 是 通过 
执行 事先 编 好 的 某 个 特定 的 程序 来 完成 的 。 


= 


© 


© 


© 


© 


© 


x100 0000 0000 0000 ISRP14 


© 


1) 程序 计数 器 (PC) 加 载 源 自 ERET 寡 人 存 器 的 异常 返回 值 ， 且 ERSTATUS 的 内 容 应 复制 到 STATUS32 中 ，ERBTA 寄 存 器 的 内 容 也 应 
复制 到 BTA 寄 人 存 器 中 。 


2) 在 内 核 模 式 下 使 用 KFLAG 指 令 可 以 将 AE 位 设置 为 任意 值 。 
3) 如 果 将 STATUS32[DFE] 位 设置 为 RTIE 指 令 ， 处 理 器 会 进入 一 个 未 响应 的 分 文 延迟 模 状 态 。 


为 了 减少 不 必要 的 上 下 文 现场 保 仔 ， 当 ARC EM 处 理 器 从 某 一 中 断 返 回 且 存 在 其 他 未 响应 的 使 能 中 断 时 ， 处 理 器 首先 找 出 未 响应 中 
断 的 最 高 优先 级 ， 并 将 其 与 STATUS32 的 中 断 闻 值 进行 比较 ， 如 果 需 要 进行 中 断 处 理 ， 则 跳 转 至 该 未 响应 中 断 的 向 量 入 口 进行 中 断 服务 
处 理 ， 直 全 服务 完 万 有 内 层 中 断 再 恢复 之前 的 中 断 现场 。 


46 小结 


本 章 介绍 了 ARC EM 处 理 器 中 断 及 异常 处 理 的 基本 原理 ， 以 及 各 种 中 断 及 异常 的 工作 模式 、 类 型 、 优 先 级 及 寄存 器 配置 等 ， 并 对 相 
天 部 分 给 出 实例 说明， 读者 需要 结合 实验 来 加 深 对 异常 处 理 和 向 量 中 断 的 理解 。 


下 一 章 将 介绍 ARC 汇 编 语 言及 其 程序 设计 、 编 译 等 。 


第 5 章 ” 汇 编 语 言 程 序 设计 


本 章 将 概要 地 介绍 ARC 汇 编 语 言 ， 主 要 介绍 ARC 汇 编 语言 的 伪 指 令 、ARC 汇 编 语 言语 句 格式 、ARC 汇 编 语言 程序 设计 ， 以 及 ARC 汇 


编 语言 与 C/C++ 的 混合 编程 。 


5.1 ARC 汇编 语言 


汇编 程序 是 运行 在 特定 微 处 理 器 的 机 器 语句 。 汇 编程 序 设 计 采 用 汇编 语言 编写 源 程序 ， 通 过 汇编 器 汇编 成 目标 机 器 的 二 进 制 代 码 。 
ARC 汇 编 语言 与 其 他 高 级 语言 不 同 ， 它 是 面向 机 器 的 一 种 低级 语言 ， 可 直接 对 硬件 进行 操作 ， 执 行 效率 高 ， 但 进行 复杂 的 程序 设计 时 难 
度 较 大 。 汇 编 语言 比 机 器 语言 易于 读 写 ， 具 有 机 器 语言 执行 速度 快 ， 占 用 内 存 少 等 优 忠 。 但 是 汇编 语言 依赖 具体 处 理 器 结构 ， 不 同 处 理 
器 结构 之 间 不 能 通用 。 


汇编 语言 在 软件 设计 流程 中 的 位 置 如 图 5-1 所 示 。 


SHADE ELM 编程 — ft — UNA 


T — 
标准 建 汇编 语言 


+- CHA 
模 语言 


—— C/C++ 


设计 文档 HLP 源 代码 


日 标 文 件 


图 5-1 汇编 语言 在 软件 设计 流程 中 的 位 置 图 


5.2 ”ARC 汇编 语言 伪 所 令 


5.2.1 (Lae Sate Sit 


在 ARC 汇 编 语 言 中 ， 有 一 些 特殊 的 指令 助 记 符 。 这 些 助 记 符 与 措 令 系统 的 助 记 符 不 同 ， 没 有 相对 应 的 操作 码 ， 通 剃 称 这 些 特殊 的 助 
记 符 为 伪 措 令 ， 所 完成 的 操作 称 为 伪 操 作 。 伪 指令 在 源 程 序 中 的 作用 是 指导 汇编 器 处 理 汇 编程 序 的 行为 ， 这 些 伪 指 令 仪 在 汇编 过 程 中 起 
作用 ,一 旦 汇编 结束 ， 伪 指令 的 使 命 束 结 束 。 


5.3 ”ARGCG[L 编 语言 语句 格式 


5.3.1 ”汇编 语言 属 式 己 例 子 
ARC 汇 编 语言 格式 由 1~4 个 部 分 组 成 ， 包 含 以 下 字段 : 


[label:] opcode [operands] [; comment] 


[标号 ] 操作 码 [操作 数 ] [7 注释 ] 


标号 : 位 置 标记 ， 有 具体 使 用 规则 见 5.3.4 闻 。 

- 操作 码 : ARC 汇 编 指 令 的 操作 码 ， 通 常情 况 下 是 ARC 处 理 器 指令 的 助 记 符 。 

同时 ， 操 作 码 字段 可 以 是 一 个 汇编 程序 指令 (也 称 为 伪 操 作 ) 或 用 户 自 定义 的 宾 。 宏 具体 规则 见 5.3.7 节 。 操 作 码 字段 可 以 从 任意 
列 开 始 。 

: 操作 数 : 操作 数 是 在 操作 码 字 段 的 指令 的 和 参数， 与 操作 码 字 段 之 间 空 格 分 隔 。 

- ARC 汇 编 指 令 的 操作 数 ， 可 以 是 标识 符 、 常 量 ， 或 者 包含 一 个 或 多 个 标识 符 / 常 量 的 表达 式 。 本 章 后 面 小 节 将 详细 介绍 ARC 汇 编 
标识 符 及 常量 的 具体 规则 。 


AT 


-f 注释 是 包含 汇编 语句 相关 信息 或 一 组 信息 。 注 释 字 段 是 可 选 的 。 如 果 注 释 在 操作 码 或 操作 数 之 后 ， 使 用 空格 分 隔 带 分 隔 符 


注释 和 操作 数 或 操作 码 。 注 释 可 以 在 任意 列 开始 ， 在 注释 前 添加 分 隔 符 。 在 ARC 汇 编 语言 格式 中 ， 注 释 用 “; ”或 者 “#” 开 始 ， 本 


ID. 
Ws 


行 之 后 部 分 到 本 行 语 自 结 来， 都 会 被 当 作 注释 。 
结合 上 一 闻 ARC 汇 编 语言 的 伪 扎 令 ， 下 面 举例 况 明 ARC 汇 编 使 用 。 
(1) .set 和 .equ 指 令 用 法 


.Set 和 .equ 指 令 使 用 标号 表示 表达 式 。 一 个 标号 锐 用 于 一 个 伪 措 令 或 指令 ， 它 茶 换 其 相应 括号 内 的 表达 式 。 如 果 其 相应 的 表达 也 是 
一 个 常量 表达 式 ， 奉 换 的 标号 可 以 在 常量 表达 式 中 使 用 。 


句法 : label[:].equ expression 
例 : 


大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 类 大 大 类 类 大 大 大 大 大 大 大 类 大 大 类 大 大 大 大 大 大 大 大 大 
* 设置 一 个 常量 count=1000*2+3 * 

* 将 其 用 于 ADD 指 令 中 * 

大 大 大 大 大 大 类 大 大 大大 大 大 大大 类 类 大 大 大大 类 类 类 大大 大 大 大 大大 类 大 大大 类 大大 类 类 大 
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ADD A1,A22,const 


大 大 大 大 大 大 大 大 类 类 类 大 大 大 大 大大 类 类 类 大 大 大 大 大 类 大 大 大 大 大 类 大 类 类 大 大 大 类 类 大 
* 将 当前 的 部 分 程序 计数 器 加 4 分 配给 target * 
大 大 大 大 大 大 大 大 类 类 类 大 大 大 大 类 大 类 大大 大 大 大 大 类 类 大 大 大 大 大 类 大 类 类 大 大 大 类 类 大 


target .equ $+4 


KKK KKK KKK KKK KKK KKK KKK KKK KK KKK KK KKK KK KKKK 


* ITAL R * 


大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大大 大 大 大 大 大 大 


SIZE .equ 120 
ALIGN .equ 8 
.bss foo, SIZE, ALIGN 


(2) .bss 指 令 用 法 
.bss 指 令 将 未 初始 化 的 数据 存储 到 .bss 段 。 如 果 指 定 对 齐 方式 ， 当 前 .bss 段 的 位 置 数 据 是 在 数据 保留 前 对 齐 的 。 


句法 : .bss symbol,size[,alignment] 


例 : 


.bss foo, 123 
.bss fum, SIZE >> 2, 8 


SIZE 必 须 是 一 个 均等 的 常量 。 


(3) .short 与 .half 指 令 用 法 


.Short 与 .hal 人 令 是 同义词 。 访 指令 在 当前 区 间 把 一 个 或 多 个 16 位 整数 放 到 连续 字 节 中 。 字 书 的 确切 位 置 取 决 于 处 理 器 采用 的 是 大 
映 还 是 小 端 格式 。 如 果 标号 在 .short 或 .half 之 前 使 用 ， 它 指向 的 是 第 一 个 被 初始 化 的 子 节 。 


句法 : .half value[ http://www.hzcourse.com/resource/readBook? 


path=/openresources/teach ebook/uncompressed/15453/OEBPS/Text/...,value] 
例 : 


short 0x1234 

short 1974 

short -1 

short OblOl01 

short ((900+0x12*10) + one) 
One aset 1 


(4) .float 与 .double 指 令 用 法 
.float 与 .double 指 令 在 当前 区 | 间 放 置 一 个 IEEE 754 浮 点 数 为 连续 字 节 。 字 蔬 的 确切 位 置 取 决 于 处 理 器 采用 的 是 大 痛 还 是 小 痛 格 式 。 
` .float 生 成 一 个 单 精度 浮 点 数 。 

,double 生成 一 个 双 精 度 浮 点 数 。 
涉及 IEEE 754: 


. 单 精 度 宽度 : 32 位 ， 数 值 部 分 : 2442, FA: 8 位 。 


- 双 精 度 宽度 : 6442, BAR SRD: 53 位， 指数 : 11 位 。 


如 果 一 个 标号 前 使 用 .float， 它 指向 第 一 个 被 切 始 化 的 字 节 。 
句法 : .float value 
例 : 


.float 16.2E-2 ; 单 精度 浮 点 数 
double -47.5534E-26 ; 双 精 度 浮 点 数 


(5) .byte 指 令 用 法 

.byte 指 令 将 字 节 从 一 个 或 多 个 表达 式 或 字符 组 成 的 字符 串 添加 到 当前 区 间 中 。 一 个 带 引 号 的 字符 串 ， 字 符 串 的 每 个 字符 被 视 为 一 
个 单一 的 8 位 值 。 该 字符 串 中 的 字符 被 放 入 连续 字 节 当前 区 间 。 一 个 表达 式 ， 它 的 值 将 被 截取 为 8 位 。 如 果 一 个 标号 在 .byte 之 前 使 用 
时 ， 它 指向 第 一 个 被 初始 化 的 字 节 。 


句法 : .byte value[,http://www.hzcourse.com/resource/readBook? 


path=/openresources/teach_ebook/uncompressed/15453/OEBPS/Text/..., value] 


Gil: 
spyte 0, L2 


(6) .4byte、.word 和 .long 指 令 用 法 
.Word，.long 和 .4byte 是 同 义 指令 。 这 个 指令 将 一 个 或 多 个 32 位 整 型 常量 放 到 当前 区 间 的 连续 字 节 。 字 节 的 确切 位 置 取决 于 处 理 器 
SKF ARE Nim Sx. 


句法 : .word value[,http://www.hzcourse.com/resource/readBook? 


path=/openresources/teach_ ebook/uncompressed/15453/OEBPS/Text/..., value] 
例 : 


LAB: 
word: 0 
.word LAB + 4 
. word (2 + 3) = 4 
(7) .ascii 与 .string 措 令 用 法 


.ascii 和 和 .string 是 同 义 指令 。 这 个 指令 添加 字 节 (一 个 或 多 个 字符 串 字 证 ) 到 当前 区 | 间 中 ， 如 果 一 个 标号 使 用 这 个 指令 ， 它 指向 第 一 
个 字符 串 的 第 一 个 字符 。 
句法 : .string string value[,http://www.hzcourse.com/resource/readBook? 


path=/openresources/teach_ebook/uncompressed/15453/OEBPS/Text/...,string_value] 
例 : 


.String "This is a string value” 
.ascii "This", "is", "string", "value" 


以 上 两 个 实例 具有 相同 的 效果 。 


(8) .asciz 指 令 用 法 
.asciz 指 令 将 字 节 从 一 个 或 多 个 字符 添加 a 到 当前 区 | 间 中 。 每 个 字符 串 后 添加 一 个 空 字符 。 如 果 一 个 标号 使 用 这 个 措 令 ， 它 指向 第 一 
个 字符 捉 的 第 一 个 字符 。 


句法 : .asciz string valuel,http://www.hzcourse.com/resource/readBook? 


path=/openresources/teach_ebook/uncompressed/15453/OEBPS/Text/...,string_value] 
例 : 


.asciz "This is a string value" 
-ascCrz “Tis, Must, "string"; "valgae" 


(9) .err 指 令 用 法 
.err 指 令 将 引发 错误 消息 。 该 指令 提供 一 个 退出 码 ， 汇 编 终止 时 立即 返回 退出 码 。 如 果 没 有 指定 退出 代码 ， 汇 编 器 继续 解析 当前 的 
输入 文件 ， 但 是 不 会 产生 输入 文件 生成 的 输出 目标 文件 。 


句法 : .err message[exit code] 


54 ARC 汇编 语言 程序 ; 


分 类 


例 : 


.err "Invalid operations" 


在 ARC 指 令 


集 及 汇编 
类 ， 可 把 程序 分 为 简单 程序 、 


语言 伪 指 令 


分 支 程 序 、 


git 


基础 上 ， 程 序 设 计 人 员 可 以 参照 汇编 语言 格式 要 求 来 进行 汇编 源 程序 的 编写 。 按 程序 的 功 角 


循环 程序 和 子 程序 等 类 型 。 任 何 复杂 的 程序 结构 可 看 作 这 些 基 本 结构 的 组 合 


5.5 ”ARCL 编 语言 程序 实例 


执行 


5, 6 ARG 汇编 语言 ES 


bot 
2 


构 来 


以 下 是 一 个 完整 的 使 用 ARC 汇 编程 序 设计 的 片 外 仓储 器 访问 实例 ， 里 面 涉及 了 ARC 汇 编 器 伪 捐 令 和 中 断 异 单身 量 入 口 定 义 ， 程 序 的 


.include code.s 


.equ 
.equ 
.equ 


.Section 


.global 
.long 
. long 
. Long 


teger: 
mem err: 
Ins Err: 


states 


add s 


mov — 


add s 


load mem lp end: 


st 
cmp s 


UM (OxEO , 0xE0+29) 


mov.eq 
nop 
nop 
mem err handler: 
ine err handler: 
flag 
nop 
nop 
.data 
data area: 


PASS CODE, 
FAIL CODE, 
HALT, 
vectors,text 
Stare 
Stare 


过 程 既 使 用 了 顺序 执行 ， 也 使 用 了 循环 。 


CORE | ASSEMBLER | 0 | CORETEST | PASSED 
CORE | ASSEMBLER | 0 | CORETEST | FAILED 


1 
; 向量 表 


mem | err handler 
ins err. - handler 


r26, FAIL CODE 
r0, data area 
LP COUNT, 30 
init mem lp end 
rO, [r0] 

rO, rO, 1 


ri, 0 

LP COUNT, 30 
load mem | ip end 
x0, r0, 1 

r2, [r0] 

ri, rl, r2 


ri, [r0] 
ri, 7155 


r26, PASS CODE 


HALT 


;开始 程序 
;初始 化 
;数据 段 开 始 地 址 


;将 r0 的 值 显示 在 跟踪 调试 文件 中 


;地 址 后 移 
PER 
ENR h% 


; ps 的 值 显示 在 跟踪 调试 文件 中 
;结果 比较 


;使 处 理 器 挂 起 以 终止 测试 


;EOF 结 束 


与 C/C++ 的 混合 编程 


ARC 汇 编 语 言 具 备 较 强 的 硬件 直接 操作 能 力 ， 对 于 底层 的 初始 化 及 驱动 使 用 汇编 语言 ， 而 对 于 大 部 分 应 用 程序 则 使 用 C/C++ 语 
言 ， 因 此 在 实际 应 用 中 使 用 汇编 语言 与 C/C++ 的 竟 合 编程 。ARC 处 理 器 体系 结构 支持 汇编 语言 与 C/C++ 的 竟 合 编程 。 下 面 主要 介绍 汇 
编 语言 与 C/C++ 之 间 互 相 调用 、 混 合 编程 。 


5.7 ”小结 


本 章 主要 介绍 ARC 汇 编 语 言 ， 包 括 ARC 汇 编 语言 的 伪 指 令 、ARC 汇 编 语 言语 句 格 式 、ARC 汇 编 语 言 程序 设计 以 及 ARC 汇 编 语言 扯 
C/C++ 的 混合 编程 ， 并 对 相关 内 容 给 出 了 实例 。 


下 一 章 将 介绍 ARC EM 处 理 器 的 开发 及 调试 环境 等 。 


第 6 章 ARC EM 处 理 器 的 开 友 及 调试 环境 


本 章 主要 介绍 ARC EM 处 理 器 的 开 上 友 及 调试 环境 ， 其 中 包括 MetaWare 开 友 套 件 、Meta-Ware 1DE 开 友 系 统 及 开 友 流程 ， 使 用 
MWDT 调 试 器 进行 性 能 分 析 以 及 ARC GNU 介 绍 等 。 


6.1 MetaWare 开 发 套件 


DesignWare ARC MetaWare 开 友 套 件 (MetaWare Development Toolkit, MWDT) 是 在 有 着 25 年 行业 领先 的 编译 器 和 调试 器 
产品 的 基础 上 开 友 的 。 该 套件 是 用 于 Synopsys DesignWare ARC 处 理 器 开 友 的 完整 解决 方案， 包含 广 持 开 友 、 仿 真 、 调 试 和 诅 入 陈 应 
用 程序 优化 的 所 有 组 件 。 该 开发 套件 支持 全 系列 ARC 处 理 器 ， 从 高 速 ARC HS 系列 ， 到 深度 从 入 式 ARC EM 系列 ， 再 到 适用 于 高 性 能 的 
通用 ARC 600 系 列 、ARC 700 系 列 以 及 ARC AS200 首 频 处 理 器 。 如 图 6-1 所 示 ，MetaWare 开 友人 套件 包含 了 开发 过 程 中 编程 、 仿 真 以 及 
调试 的 所 有 软件 工具 。 主 要 包括 编译 器 (compiler) 、 链 接 器 (linker) 、 汇 编 器 (assembler) 、 调 试 器 (debugger) 、 仿 真 器 

(debugger simulators) 以 及 集成 开 上 友 环 境 (MetaWare IDE) 等 。 其 中 与 编译 相关 的 编译 器 、 连 接 器 和 汇编 器 以 及 运行 时 库 也 统称 
为 MetaWare C/C++ 工具 链 。 


汇编 课文 件 
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性 能 分 析 
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图 6-1 DesignWare ARC MetaWare 开 发 套件 


MetaWare 集 成 开发 环境 集成 了 MetaWare 开 发 套件 中 的 主要 组 件 ， 同 时 提供 一 个 友好 的 图 形 化 操作 界面 ， 使 用 户 在 统一 的 图 形 界 
面 下 进行 程序 编译 与 调试 。 此 外 ，MetaWare 1DE 图 形 界面 允许 用 户 增加 其 他 工具 ， 同 时 通过 可 配置 技术 定义 使 用 范围 ， 以 加 速 关 键 代 
码 ， 提 高 运行 效率 。 当 然 ，MetaWare 开 发 套件 中 的 软件 工具 例如 编译 器 、 调 试 器 等 也 可 以 在 MetaWare IDE 之 外 被 直接 调用 ， 独 立 工 
作 。 


MetaWare 开 发 套件 并 不 是 免费 软件 ， 必 须要 获得 Synopsys 公 司 授权 才能 运行 。 除 了 MetaWare 开 发 套件 之 外 ，Synopsys ARC 还 
提供 免费 开源 的 ARC GCC 工 具 链 、GDB 调 试 器 以 及 软件 开发 包 ， 既 可 用 于 个 人 学 习 和 了 解 ARC 处 理 器 ， 也 可 用 于 基于 ARC 人 处理 器 的 嵌 
入 式 系 统 的 开发 与 编程 。 


6.2 MetaWare 1DE 开 发 拒 南 


6.2.1 创建 与 官 理工 程 


MetaWare IDE 是 以 视图 的 万 式 组 织 的 。C/C++ 视 图 提供 编码 任务 的 视图 ， 调 试 视图 提供 调试 任务 的 视图 (其 他 的 视图 也 可 以 单 
击 “ 查 看 ”-> “视图 ”-> “其 他 ”来 切换 ) 。 在 IDE 标 题 栏 中 的 第 一 个 选项 告知 在 哪 一 个 视图 中 ， 如 图 6-2 所 示 。 


> [加 CCE++ - MetaWare IDE 
File Edit Source Refactor Navigate Search Run Proj 


| mt 
* A, 


图 6-2 MetaWare IDE 标题 栏 


如 果 没 有 看 见 C/C++ 视 图 ， 可 能 需要 天 闭 欢 迎 界面 。 如 果 之 前 天 闭 了 欢迎 视图 ，MateWare IDE 记 住 并 开始 显示 有 C/C++ 视图 的 
项 目次 源 管 理 器 。 


使 用 MetaWare 1DE 集 成 开 友 环境 ， 创 建 工程 并 加 载 例 程 代 码 。 以 工程 为 单位 ， 配 置 编译 选项 、 编 译 例 程 代码 ， 对 编译 生成 的 可 执 


行文 件 进行 调试 分 析 。 


1. 建 立 工程 


M C/C++ - Meta Warc IDE 


Flal| Edit Source Refactor Navigate Search Project Run Window Help 


New 

Open File... 
Close 
Close All 


Save 


| Save As... 


Save All 
Revert 
Move... 


Rename... 


| Refresh 


Convert Line Delimiters To 


= Print. 


LE 


Switch Workspace 

Restart 

Import... 

Export... 

Properties 

Exit 
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Alte ShifteN k | 
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Ctrl «Shift WW 


Ctrl +5 


Cil - Shift-5 


Alt+ Enter 
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1) 打开 MetaWare IDE， 创 建 一 个 名 为 demo 的 空 工 程 (project) ， 选 择 ARC EM 系列 处 理 器 ， 如 图 6-3 所 示 。 


Makefile Project with Existing Code 
C++ Project 

C Project 

Project... 


? Navigate | 


Convert to a C/C++ Project (Adds C/C++ Nature] 
Source Folder 

Folder | z 5 had bdbád ha RadsR ded Cee ee ee "REEL AR REGE ERE AU 
Source File i — ; | — i i ; iss | 
Header File 

File from Template 


Class 


Other... Ctr « N 


d Code Samples 


Projects ihat you can buid, run, and d&anug 


ing 


D wil Workspaces and projects 


To return here, go to 
Help - Welcome 


20M of 47M 


图 6-3 HERA 


2) ERRIA, WF NF -> “新 建 ”-> “项 目 ”， 则 新 建 项 目 对 话 框 被 打开 。 


3) 在 新 建 项 目 对 话 框 中 ， 展 开 C/C++， 选 择 C 项 目 ， 然 后 单 击 Next 按 钮 ， 如 图 6-4 所 示 。 


Select a wizard 


Create a new C project 


Wizards: 


type filter text | 


> (2 General 
4 (= C/C++ 
C Project 
C++ Project 
Makefile Project with Existing Code 


图 6-4 选择 C 项 目 


4) 选择 ARC EM 处 理 器 ， 如 图 6-5 所 示 。 


M C Project 


C Project 
Create C project of selected type 


Project name demo 


Use default location 


Location: | C:\Users\jyshen\mide\workspace\demo 


Project type: Toolchains: 

4 (= Executable ARC 5 

和 Empty Project ARC 600 

© Hello World MetaWare C++ Project ARC 601 

© Hello World ANSI C Project ARC 700 
> (g» Shared Library | ARC EM Generic 
> (g Static Library ARC EMA 
b E Makefile project ARC HS 

ARC Legacy 
& 


latform 


图 6-5 IDE 新 建 项 目 对 话 杠 


2. 向 工程 demo 导 入 代码 文件 CoreTest.c 


在 MetaWare IDE 主 界面 的 左 侧 Project Explorer 处 用 鼠标 左 键 单 击 图 标 “ 至 sm。 ， 接 着 人 在 阐 出 菜单 中 选择 Import， 如 图 6-6 所 示 。 


[T] C/C» -Metaware IDE 
Fie Edt Source Refactor Navigate Search Run Project window Help 


E [Ei eee 
le ou za (s) Ma 
An outline is not availacl 


E: Problems £2 «4 Tasks | GJ Coreale | E Properties. 


O teme 
Descrcbon + Resource Path Location | Typ 


O tems selected 


K6-6 ÆM]Project Exploret 选 项 


此 时 ， 弹 出 一 个 名 为 Import 的 对 话 框 ， 选 择 General 选 项 卡 中 的 File system 一 项 ， 然 后 单 击 Next 按 钮 ， 如 图 6-7 所 示 。 添 加 源 代 码 
CoreTest.c 所 在 文件 目录 ， 对 话 框 会 自动 显示 目录 的 名 称 以 及 目录 所 包含 文件 的 文件 名 。 选 择 待 添加 文件 CoreTest.c， 然 后 单 击 Finish 


按钮 ， 完 成 整个 导入 过 程 。 
例 程 代码 程序 demo.c 如 下 : 


LIE A Ed d E E ue Id su P 

// 该 演示 程序 的 功能 是 查找 数据 点 x 和 y 的 最 小 距离 

// #define/undefine ' DEBUG' 预 编译 器 变量 ， 以 获得 所 需 的 功能 

// 包括 DEBUG 会 导入 I/O 库 ， 以 打印 搜索 结果 

// 为 了 人 简单 起 见 ， 将 计算 中 用 到 的 数据 点 硬 编码 到 POINTX 和 POINTY 中 

VIITEIAT ISAT A A I 

#ifdef DEBUG 

#include "stdio.h" 

#endif 

#define POINTX {1, 2, 3, 4, 5, 

#define POINTY {2, 4, 6, 8, 10, 1 

#define POINTS 10 

#define GetError (x, y, Px, Py) \ 
( (Px)? GPx) + (y-Py)*(y-Py}) ) 

int main (intargc, char* argv[]) { 
intpPointX[] = POINTX; 


Du dy “Op My LOT 
27 l4, l6, 18, 20} 


intpPointY[] = POINTY; 
int x, y; 
int index, error, minindex, minerror; 
x = 4; 
y — 5; 
minerror = GetError(x, y, pPointX[0], pPointY[0]); 
minindex = 0; 
for (index = 1; index < POINTS; index++) { 
error = GetError(x, y, pPointX[index], pPointY [index]) ; 
if (error <minerror) { 
minerror = error; 


minindex = index; 


#ifdef DEBUG 


printf ("minindex = %d, minerror = %d.\n", minindex, minerror) ; 
printf ("The point is (%d, %d).\n", pPointX[minindex], pPointY [minindex] ) ; 
getchar (); 

fendif 
return 0; 
) 

M Import 

File system /一 一 
Import resources from the local file system. | j 


From directory: C:\Users\jyshen\Desktop\ ARC University\Ex4_ProfilingWithISS\Solutioi v 


(=> Solution 


[€] CoreTest.c 
F| Bl run-tet 


Filter Types... Select All Deselect All 
Into folder: demo 


Options 
| Overwrite existing resources without warning 


| | Create top-level folder 


图 6-7 完成 新 建 项 目 对 话 框 


导入 完毕 后 ， 可 以 在 MetaWare IDE 主 界面 的 左 侧 Project Explorer 处 看 到 刚才 添加 过 的 代码 文件 CoreTest.c。 


63 ”使 用 MetaWare 调 试 器 进行 性 能 分 析 


性 能 分 析 (performance analysis， 也 称 为 profiling) ， 是 以 收集 程序 运行 时 信息 为 手段 研究 程序 行为 的 分 析 方 法 ， 是 一 种 动态 程 


序 分 析 的 方法 。 性 屁 分 析 量 测 项 包括 程序 的 空间 或 时 间 复 杂 度 、 特 定 指令 的 使 用 情形 、 立 数 调 用 的 频率 及 运行 时 间 等 。 性 能 分 析 的 目的 


在 于 决定 程序 的 运行 哪个 部 分 应 该 被 优化 ， 从 而 提高 程序 的 运行 速度 或 者 内 存 使 用 效率 。 


性 能 分 析 可 以 由 程序 的 源 代码 或 是 可 执行 文件 进行 ， 一 般 使 用 所 谓 的 性 能 分 析 器 (profiler) 之 类 的 工具 进行 。 性 能 分 析 工 具 采 用 
许多 不 同 的 技术 ， 如 基于 事件 的 、 基 于 统计 的 、 基 于 指令 导向 的 以 及 基于 仿真 的 方法 等 。 性 能 分 析 工 具 常 在 工程 调试 过 程 中 使 用 。 


MetaWare 调 试 器 具备 Profiling 功 能 。 用 户 通过 性 能 分 析 窗 口 可 以 看 见 和 执行 程序 相 天 的 性 能 信息 ， 访 信息 是 由 MetaWare 
C/C++ 运 行 时 间 和 应 用 程序 分 析 结 果 提 供 的 。 性 能 分 析 采 用 间 隅 定时 器 以 固定 周期 中 断 可 执行 程序 。 当 程序 中 断 时 ， 性 能 分 析 工 具 目 
动 统计 中 断 次 数 ， 统 计 的 结果 近似 地 反映 了 程序 所 消耗 时 间 。 分 析 窗 口 可 以 忌 结 出 程序 中 的 冰 数 的 指令 数 、 循 环 次 数 和 缓 仔 未 合 中 数 。 


以 6.2.1 节 中 程序 demo.c 为 例 ， 打 开 编 译 选 项 对 话 框 ， 在 Optimization/Debugging 一 栏 将 Optimization Level 设 为 -O0。 然 后 单 
击 | 念 重新 编译 工程 完毕 后 单 击 ”进入 调试 界面 。 单 击 调试 界面 主 菜单 中 的 Debugger， 在 弹出 的 下 拉 菜 单 中 选择 Disassembly， 打 
开 反 汇编 代码 窗口 ， 可 以 看 到 此 时 程序 暂停 在 main(0 国 数 的 入 口 处 。 以 同样 的 方式 在 Debugger 下 拉 荣 单 中 选择 Profiling， 打 开 性 能 分 
析 窗 口 并 单 击 窗口 中 的 图 标 全 ”， 如 图 6-21 所 示 。 


W Profiling 2 | 


J M I H N68 INT ticks! p44 ]ahle ™ >< Gg Instruction counts 
Profile of Instruction counts: 


A cumulative selt num ave. 
total count count calls cnt/call address name 
TE 255 255 255 00010620 memchr 
.21 356 101 101 00010404 a5 strlen 
.85 428 72 36 000108fc hl message ap 
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.04 552 62 62 000104a0 memcpy 
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-15 725 51 17 00010b84 priority eng 
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图 6-21 代码 性 能 分 析 


Profiling 窗 口 显示 的 当前 调试 窗口 下 程序 已 执行 指令 数目 与 各 个 立 数 对 应 关系。 从 左 到 右 依 次 为 浮 数 据 令 执行 尽数 占 整个 程序 指令 
执行 尽数 的 百分比 、 累 计 指 令 执 行 尽数、 沙 数 包含 指令 执行 忌 数 、 了 水 数 被 调用 次 数 、 函 数 包含 措 令 数目 、 遂 数 地 址 以 及 遂 数 名 。 通 过 
Profiling 窗 口 的 指令 信息 与 图 数 关系 ， 可 以 十 分 方便 地 分 析 程 序 效率 ， 找 到 程序 性 能 的 瓶颈 。 


下 面 以 demo.c 程 序 为 例 ， 继 续 具体 介绍 Profiling 窗 口 的 使 用 。 此 时 程序 暂停 在 main0 函 数 入 口 处 ，Profiling 窗 口 一 打开 如 图 6-21 
所 示 。 一 般 main( 函 数 是 性 能 分 析 优化 的 主要 对 象 ， 此 时 Profiling 窗 口中 所 显示 的 内 容 实际 上 是 main() 函 数 执行 之 前 处 理 器 进行 初始 化 
的 一 些 函数 信息 。 单 击 Profiling 窗 口中 的 图 标 2 ， 清 除 当前 信息 ， 此 时 如 果 再 单 击 图 标 S7 ， 不 会 有 任何 内 容 显示 ， 说 明 清除 成 
功 。 然 后 ， 在 main( 函 数 最 后 一 条 语句 (C 语 句 或 者 汇编 语句 缘 可 ) 处 设置 一 个 断 点 ， 单 击 调试 界面 上 方 工具 栏 中 的 图 标 ，” ， 让 程序 
执行 至 断 点 。 接 着 ， 再 次 单 击 Profiling 窗 口中 的 图 标 号 ， 此 时 显示 的 就 是 仅仅 与 main0 函 数 有 关 的 信息 了 ， 如 图 6-22 所 示 。 因 此 ， 
灵活 地 设置 断 点 ， 配 合 清除 功能 ， 就 能 对 最 为 关心 的 程序 段 进行 性 能 分 析 了 。 


— | 
= 
- WW 6 IT ti A -»17 E9 Instruction counts 
C o" 


cumulative self num avg. 
count count calls cnt/call address name 
2064 2064 20 103 00010324 mw mpy 32x32y32 
2390 326 000180c8 main 
2476 86 43 000104230 memcpy 


图 6-22 ”改进 后 的 代码 性 能 


FLAGS main eX AFA EL mw mpy _32x32y32 被 调用 了 20 次 ， 共 执行 了 2064 条 指令 ， 而 main(0) 逆 数 本 身 仅仅 执行 了 
326 条 指令 ，memcpy 函 数 执行 了 86 条 指令 。 由 此 可 见 ， 程 序 的 乘法 功能 的 实现 消耗 了 大 量 的 提 令 数目 ， 大 量 的 指令 数目 意味 着 处 理 嚣 
将 花费 大 量 的 运算 周期 去 做 乘法 运算 。 因 此 乘法 运算 是 当前 程序 性 能 的 瓶 贷 ， 如 果 要 提升 程序 的 性 能 ， 首 先 应 考虑 如 何 能 够 更 使 用 更 少 
的 指令 、 更 高 效 实现 乘法 运算 。 


因此 考虑 添加 一 个 硬件 乘法 单元 ， 然 后 将 程序 的 乘法 运算 使 用 硬件 单元 而 不 是 乘法 库 函 数 来 实现 ， 这 样 可 节省 大 量 的 周期 ， 性 能 医 
而 大 幅 提 升 。 如 图 6-23 所 示 为 在 编译 选项 中 配置 硬件 乘法 器 ， 选 择 32-bit multiply instruction (-Xmpy) 。 


按照 上 述 步骤 重新 编译 、 调 试 、 运 行程 序 ， 打 开 性 能 分 析 窗口 ， 并 单 击 窗口 中 的 图 标 田 ”， 如 图 6-24 所 示 。 


再 一 次 单 击 Profiling 窗 口中 的 图 标 2 清除 当前 信息 ， 此 时 如 果 再 单 击 图 标 宇 ”， 不 会 有 任何 内 容 显示 ， 说 明 清除 成 功 。 在 
main( 函 数 最 后 一 条 语句 (CORACAO KT) 处 设置 一 个 断 点 ， 单 击 调试 界面 上 方 工具 栏 中 的 图 标 | ，” ， 让 程序 执行 至 断 点 。 
接着 ， 再 次 单 击 Profiling 窗 口中 的 图 标 空 ”， 此 时 显示 的 就 是 仅仅 与 main0 函 数 有 关 的 信息 了 。 如 图 6-25 所 示 为 配置 完 冬 法 器 优化 后 
的 代码 。 


从 图 6-25 可 以 看 出 ， 改 进 后 的 代码 指令 明显 减少 ， 使 用 硬件 乘法 单元 取代 乘法 库 函 数 mw_mpy 32x32y32, 减少 了 2000 多 条 指 
令 。 同 时 main 函 数 和 memcpy 函 数 执行 的 指令 也 相应 减少 。 代 码 执行 更 快 ， 效 率 更 高 。 


M Properties for demo 


|type filter text Settings 


p Resource 
Builders 
4 C/C++ Build 
Build Variables 
Discovery Options 
Environment 
Logging 
Settings 
Tool Chain Editor 
p C/C++ General 
Project References 
Run/Debug Settings 


TCF Association) & Tool Settings | Æ Build Steps 


4 & MetaWare ARC EM C/C++ Compiler 


ÈÈ General 

ÈÈ Optimization/Debugging 
(3 Storage Mapping 

(3 Preprocessor 

(83 Include Directories 

B C++ 

(3 Processor/Extensions 

(83 Memory Model 

(S3 Overlay Support 

ÈÈ Special Register Widths 


4 By ARCompact Assembler 


ÈÈ Assembler Preprocessor 
(S General 

(33 Include paths 

(8 ARCompact Specific 


4 & MetaWare Linker for ARCompact 


cumulative 
count 

373 

477 

578 


2 cumulative 
total count 
277 
361 


76.73 
23.27 


ÈÈ Runtime Libraries 

ÈÈ Search Path 

(33 Additional Object Files & Libraries 

ÈÈ Command files 

È Map Listing 

ÈÈ Output Generation 

(3 Miscellaneous 

& Extension settings (inherited from Compiler) 
ÈÈ Overlay Support 


A 6-23 


avg. 
cnt/call 
373 

184 

50 

29 
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Configuration: | Debug [ Active ] v | | Manage Configurations... 


“> Build Artifact | |n) Binary Parsers 


ARC EM Core 


[J] Barrel shifter (-Xbs) 
Shift Assist (-Xsa) 
[4] 32-bit multiply instruction (-Xmpy) 


16-by-16-bit multiply(-Xmpy16) 


(radix 


Integer divide (-Xdiv remz) 


[J] Bit scan instructions (-Xbitscan) 

[4] Swap instruction (-Xswap) 

[J] Code density extension (-Xcd) 

Atomic option (-Xatomic) 

Use Timer 0 (-Xtimer0) 

Use timer 1 (-Xtimerl) 

Reduced register set (-rf16) 

Compact Single-precision floating point (-Xspfp compact) 
Fast Single-precision floating point (-Xspfp fast) 

Compact Double-precision floating point (-Xdpfp compact) 
Fast Double-precision floating point (-Xdpfp fast) 


$y TE TBI US Ao RIK BS 


address name 
00010578 memchr 
00010390 a5 strlen 
00010854 hl message ap 
0001068c hl send 
00010420 memcpy 


0e0010a60  vsmemcpy 


图 6-24 ”代码 性 能 分 析 


Profile of Instruction counts: 


self 
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| (ACE 


cnt/call address name 


000100a8 main 
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图 6-25 PEG 


42 00010420 memcpy 


的 代码 性 能 


6.4 MetaWare 人 命令 行 模式 


MetaWare 开 友 套 件 除 了 广 持 图 形 界面 开 友 以 外 ， 还 文 持 命令 行 模 式 开 友 。 在 命令 行 模式 下 ， 开 友 者 在 只 有 介 令 行 交 互 的 条 件 下 ， 
可 以 非常 高 效 地 使 用 脚本 完成 批量 的 编译 和 调试 工作 。ccac 调 用 C/C+ + 工具 链 进行 编译 ，mdb 调 用 调试 器 来 仿真 调试 。 


6.5 ARC GNU 介 绍 


针对 Linux 操 作 系统 和 裸 机 操作 系统 开 友 者 ，Synopsys ARC 提 供 了 一 套 GNU 工 具 。GNU 是 GNU”s Not UNIX 首 字母 的 组 合 ， 是 
一 种 常用 于 开 友 基于 Linux 操 作 系 统 的 藤 入 式 软 件 的 工具 套件 简称 。 该 工具 套件 是 由 Richard Stallman 提 出 的 GNU 计 划 中 的 几 个 开源 工 
具 组 成 的 ， 包 括 编译 器 、 链 接 器 、 文 本 编辑 器 、 语 法 纠 销 等 工具 。 


GNU 开 发 项 目 使 用 一 个 开放 的 开发 环境 ， 支 持 很 多 平台 ， 包 括 DesignWare ARC 处 理 器 核 。 基 于 GNU 的 工具 链 在 嵌入 式 应 用 软件 
开发 中 的 质量 、 性 能 以 及 能 在 多 个 目标 处 理 器 上 应 用 的 特点 ， 全 球 各 地 的 许多 开发 者 都 开始 使 用 该 工具 链 。 对 于 DesignWare ARCHY 
GNU 工 具 链 ， 可 以 从 GitHub 上 获得 。 同 时 GitHub 上 还 可 以 获得 最 新 版 的 预 构 建 GNU 工 具 链 和 一 个 以 Eclipse 1DE 为 基础 的 版 本 。 


考虑 到 开源 工具 链 的 重要 性 ，Synopsys ARC 投 资 了 开源 项 目 ， 例 如 GNU 适 用 于 ARC 处 理 器 核 的 Linux 内 核 ， 确 保 GitHub 上 有 不 断 
更 新 的 、 文 持 ARC 处 理 器 的 开源 CNU 工 具 链 ， 并 且 不 断 优 化 ARC CNU 工 具 链 。 


ARC GNU 工 具 链 提供 所 有 的 开源 工具 和 完整 的 源 代码 ， 包 括 GCC 编 译 器 、GDB 调 试 器 以 及 许多 的 应 用 程序 和 库 ， 从 而 构成 了 一 个 
完整 的 软件 工具 链 。 此 工具 链 是 一 个 源码 包 ， 而 非 运 行 在 用 户主 机 上 的 平台 。 另 外 ，ARC GNU 工 具 链 具备 高 度 的 可 配置 性 和 可 扩展 
性 ， 用 户 可 以 很 方便 地 按照 目 己 特定 的 需求 进行 个 性 化 定制 。 


6.6 “小结 


本 章 主 要 介绍 了 ARC EM 处 理 器 开发 及 调试 环境 。 其 中 详细 介绍 了 MWDT 开 发 套件 中 的 各 种 组 件 的 概念 和 功能 ， 主 要 包括 适用 于 各 
种 处 理 器 的 MetaWare C/C+ + 工具 链 、 调 试 器 、 仿 真 器 等 。 重 点 介绍 了 如 何 使 用 MWDT 开 发 套件 创建 、 配 置 、 编 译 及 调试 一 个 工程 ， 
即 开发 ARC EM 处 理 器 的 一 般 流程 。 此 外 ， 还 介绍 了 如 何 使 用 MetaWare 调 试 器 对 一 段 应 用 程序 进行 性 能 分 析 ， 以 及 MetaWare 命 令 行 
模式 。 最 后 简要 介绍 了 ARC GNU 的 相关 知识 。 


下 一 章 将 主要 介绍 MQX 实 时 操作 系统 ， 


第 / 章 MQX 实 时 操作 系统 


本 草 将 深入 介绍 MQX 的 微 内 核 结构 组 成 和 各 组 件 的 功能 ， 重 点 讲述 MQX 的 内 核 的 时 间 管 理 功 能 、 存 储 管理 功能 、 中 断 念 理 功 能 ， 
另外 从 信号 量 、 事 件 、 互 斥 、 消 息 和 任务 队列 等 方面 介绍 MQX 的 任务 同步 和 通信 机 制 的 实现 ， 使 读者 能 够 掌握 MQX 的 内 核 应 用 设计 。 


7.1 ”实时 操作 系统 介绍 


实时 系统 是 指 能 在 确定 的 时 间 内 执行 其 功能 ， 并 对 外 部 的 异步 事件 做 出 实时 响应 的 计算 机 系统 。 实 时 操作 系统 (Real-Time 
Operation System, RTOS) 是 指 当 外 界 事件 或 数据 产生 时 ， 能 够 接受 并 以 足够 快 的 速度 予以 处 理 ， 其 处 理 的 结果 又 能 在 规定 的 时 间 之 
内 来 控制 生产 过 程 或 对 处 理 系 统 做 出 快速 响应 ， 并 控制 所 有 实时 任务 协调 一 致 运行 的 操作 系统 。 实 时 环境 允许 一 个 实时 应 用 作为 一 系列 
独立 任务 来 运行 ， 各 任务 有 各 目的 线程 和 系统 资源 。 


实时 操作 系统 有 硬 实时 和 软 实时 之 分 ， 硬 实时 要 求 在 规定 的 时 间 内 必须 完成 操作 ， 这 是 在 操作 系统 设计 时 保证 的 ; 软 实时 则 只 要 按 
照 任务 的 优先 级 尽 可 能 快 地 完成 操作 即 可 。 通 常 使 用 的 操作 系统 在 经 过 一 定 改 变 之 后 束 可 以 变 成 实时 操作 系统 。 


RTOS 是 一 个 标准 内 核 ， 包 括 了 各 种 片上 外 设 初 始 化 和 数据 结构 的 格式 化 ， 用 户 不 必 (也 不 推荐 ) 再 对 硬件 设备 和 人 资源 进行 直接 操 
作 ， 所 有 的 硬件 设置 和 资源 访问 都 要 通过 RTOS 内 核 。 内 核 将 应 用 系统 和 底层 硬件 结合 成 一 个 完整 的 实时 操作 系统 。 移 植 的 时 候 内 核 是 
\ 变 的 。 开 友 者 根据 目 己 应 用 系统 的 需要 来 选择 实时 操作 系统 内 核 ， 开 友 者 不 能 对 内 核 随意 访问 ， 只 能 使 用 内 核 提 供 的 功能 服务 来 开 友 
目 己 的 应 用 系统 。 


RTOS 是 一 个 经 过 测试 的 内 核 ， 与 一 般 用 己 目 行 编写 的 主 程序 内 核 相 比 ，RTOS 更 规 学 ， 效 率 和 可 靠 性 更 高 。 另 外 ， 高 效率 地 进行 多 
任务 文 持 是 RTOS 设 计 从 始 至 终 的 一 条 主线 ， 采 用 RTOS 管 理 系统 可 以 统一 协调 各 个 任务 ， 优 化 CPU 时 间 和 系统 资源 分 配 ， 使 之 不 空闲 、 
不 拥塞 。 针 对 某 种 具体 应 用 ， 精 细 推 襄 的 应 用 程序 不 及 用 RTOS 可 能 比 及 用 RTOS 能 达到 更 高 的 效率 ; 但 是 对 于 大 多 数 一 般 用 户 和 新 手 而 
言 ， 采 用 RTOS 是 可 以 提高 资源 的 利用 率 ， 尤 其 是 在 片上 资源 不 断 增长 、 产 品 可 靠 性 和 上 市 时 间 更 重要 的 今天 。 


本 章 所 介绍 的 MQX (Message Queue eXecutive, 消息 队列 执行 ) Precise Software Technologies 公 司 1989 年 开发 的 一 款 启 
入 式 实时 操作 系统 。 在 2000 年 3 月 被 ARC 公 司 收购 ， 并 在 新 的 处 理 器 体系 中 (主要 包含 Freescale 的 ColdFire 系 列 、IBM/Freescale 的 
PowerPC、ARM、ARC 和 i.MX 等 ) 继续 开 友 。 上 自从 2009 年 MQX 推 出 第 一 个 版 本 RTOS3.0.1 后 ， 其 版 本 不 断 进行 升级 和 更 新 ， 功 能 不 断 
加 强 ， 目 前 推出 的 最 新 版 本 是 3.7.0。 最 新 版 MQX 可 以 配置 最 小 占用 12K Flash 和 2.5K RAM， 包 括 两 个 任务 、 一 个 轻 量 级 信号 、 中 断 、 
OFA SE. 


MQX 是 面向 应 用 的 、 专 用 定制 的 嵌入 式 实时 操作 系统 。 它 除 具 有 处理 多 任务 、 文 件 、 设 备 驱 动 等 基本 的 操作 系统 功能 之 外 ， 还 具 
有 如 下 特性 : 


1) 开放 源码 ， 成 本 低 ， 软 件 资 源 丰 襄 。 


MQX 的 内 核 源码 可 免费 下 载 ， 并 有 专业 人 员 提 供 技术 支 持 。 开 放 源 码 可 以 使 用 尸 不 必 从 头 做 起 ， 世 省 时 间 ， 降 低 费 用 。 同 时 ,在 
MQX 安 闪 目 录 下 ， 还 提供 了 大 量 的 应 用 实例 ， 软 件 人 资源 丰富 ， 可 加 快 项 目 开 友 速 度 。 


2) 采用 微 内 核 结构 ， 使 系统 体系 结构 具有 可 伸缩 性 、 可 裁减 性 。 


MQX 采 用 微 内 核 结构 ， 使 用 最 小 内 核 处 理 集 ， 系 统 开销 小 ， 运 行 效率 局 ， 可 以 根据 需要 添加 可 定制 组 件 ， 比 较 容 易 适 用 于 各 种 调 
入 式 系统 应 用 。 


3) 高 实时 响应 ， 内 核实 时 效率 高 。 


MQX 及 用 基于 优先 级 的 、 抢 占 式 调度 策略 。 带 有 最 优化 上 下 文 切 换 和 中 断 处 理 ， 用 于 实现 快速 、 高 效 的 预测 响应 时 间 ， 具 有 高 实 
时 性 。 


4) 具有 直接 应 用 编程 接口 API、 高 度 模块 化 架构 、MS-DOS 文 件 系 统 (MFS) ， 能 够 很 好 地 满足 各 种 不 同 应 用 需求 。 


使 用 RTCS 协 议 支持 统一 的 MAC 访 问 层 接口 ， 提 供 TCP/IP 协 议 栈 、FTP、Telnet、DHCP、SNMP、DNS、HTTP 等 服务 。 


7.2 MQX 内 核 组件 


MQX 由 核心 组 件 ( 必 选 ) 和 可 选 组 件 构 成 ， 其 结构 示意 图 如 图 7-1 所 示 。 中 心 为 MQX 的 核心 组 件 ， 外 围 环绕 的 是 可 选 组 件 。 为 了 
满足 应 用 需求 ， 应 用 程序 可 通过 加 入 可 选 组 件 来 扩展 和 配置 核心 组 件 。 
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图 7-1 MQX 组 件 图 


表 7-1 忌 结 了 核心 组 件 和 可 选 组件 ， 它 们 都 将 在 后 续 章节 中 详细 介绍 。 


表 7-1 MQX 核 心 组 件 和 可 选 组 件 列 表 
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EDS (Embedded Device Server) 服务 器 


是 用 户 的 一 个 具体 应 用 程序 。 在 一 个 较为 复杂 的 应 用 程序 中 ， 
是 一 个 无 限 循环 体 ，RTOS 依 靠 任 


务 总 个 


np3e Gk del) 


可 选 ( 板 级 支持 包 ) 


可 选 ( 板 级 支持 包 ) 


通常 将 一 个 大 任务 分 解 
务 管理 机 制 在 程序 运行 


管理 是 MQX 核 心 组 件 ，M QX 通 过 任务 模板 列表 定义 一 组 初始 化 模板 ， 基 于 该 模板 任务 可 以 在 处 理 器 上 创建 。 应 用 程序 运行 时 
为 同一 个 任务 创建 多 个 实例 ， 并 且 在 一 个 应 用 程序 中 不 限制 任 


数 。 应 用 程序 可 动态 改变 任 一 任 


务 的 属性 。 当 一 个 任务 终止 时 ，MQX 释 放任 务 资源 。 


MQX 中 的 任务 共有 4 种 状态 ,分 别 为 阻塞 态 、 激 活 仿 、 就 绪 态 和 终止 态 。 在 任 一 时 刻 ， 任 务 一 旦 被 创建 后 ， 其 状态 一 定 是 这 4 种 之 
一 。 任 务 状态 转换 如 图 7-2 所 示 。 
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图 7-2 ”任务 状态 转换 图 
当 任 务 处 于 不 同 的 状态 时 ， 其 活动 程度 不 同 。 下 面 按照 活动 程度 由 低 到 高 的 顺序 介绍 MQX 的 任务 状态 。 
1) 终止 态 : 任务 已 完成 或 任务 被 中 断 ， 不 再 需要 使 用 CPU。 


2) BES: 任务 由 于 某 种 原因 等 竺 一 个 事件 的 友 生 ， 如 等 待 其 他 任务 放弃 共享 资源， 目 身 延 时 一 段 时 间 等 都 会 将 任务 变 为 该 状 
态 ， 直 到 事件 友 生 或 是 等 待 的 时 间 超 过 用 户 指 定 的 时 间 为 止 。 当 条 件 具 备 时 ， 任 务 束 变 为 束 绪 仿 。 


3) MAS: 任务 已 经 就 绪 ， 但 没有 运行 ， 因 为 不 是 最 高 优先 级 的 就 绪 任务 。 处 于 这 种 状态 的 任务 可 以 被 调度 成 为 激活 态 。 


4) iom: 任务 已 经 惑 绪 ， 并 正在 运行 。 在 单 CPU 中 ， 在 有 某 一 时 刻 仪 有 且 只 有 一 个 任务 处 于 激活 态 ， 而 且 融 绪 访 中 优先 级 最 遍 的 
任务 才能 进入 激活 态 。 


此 外 ， 激 活 仿 的 任务 可 以 被 抢占 。 当 一 个 更 高 优先 级 的 任务 变 为 束 绪 仿 并 因而 变 成 活动 任务 时 ， 将 会 友 生 抢 占 。 


如 果 激 活 状 态 任 务 变 为 阻 替 状 态 或 被 抢占 ， 则 MQX 将 执行 切换 操作 ， 此 时 将 从 束 绪 队列 中 选择 合适 的 任务 并 激活 。MQX 将 选择 优 
先 级 最 高 的 任务 进入 激活 状态 。 如 果 多 个 具有 相同 优先 级 的 任务 进入 束 绪 状态 。 则 殊 绪 队列 中 的 首 任 务 先 被 激活 。 也 束 是 说 ， 每 个 就 绪 
队列 执行 先 来 先 服务 规则 。 


74 ”MQX 存 储 管理 


74.1 可 变 大 小 仔 依 块 管理 


为 了 分 配 和 释放 可 区 大 小 的 仓储 片 〈 称 为 内 仔 块 ) , MOX EH TS SUT OS Tete tay mallocOfUfreeO ERESCUTBRERSTZ/O Be 
务 。 可 以 从 默认 内 和 存 池 的 内 部 区 或 外 部 区 分 配 存储 块 给 任务 或 系统 。 分 配给 任务 的 存储 块 是 该 任务 的 资源 ， 当 任务 终止 时 ，MQX 将 释 
放 存 储 块 ， 收 回 所 分 配 的 资源 。 


当 MQX 分 配 内 存 块 时 ， 将 至 少 分 配 所 要 求 大 小 的 内 存 块 ( 亦 即 分 配 的 内 存 块 可 能 更 大 ) 。 此 外 ， 任 务 可 以 调用 mem transfer()ER 
数 转换 内 存 块 的 所 有 权 给 其 他 任务 。 表 7-6 给 出 了 及 用 可 变 大 小 的 内 存 块 管 理 内 存 的 一 些 消 数 。 


表 7-6 可 变 大 小 存储 块 管理 内 存 函数 


操作 c BY Ij 能 说 AA 
mem alloc 从 默认 内 存 池 分 配 私 有 内 存 块 
mem alloc from 从 指定 的 内 存 池 分 配 私 有 内 存 块 
(SE) 
操作 函数 功 能 说 明 
mem alloc zero 从 默认 的 内 存 池 分 配 以 0 填充 的 私有 内 存 块 
mem alloc zero from 从 指定 的 内 存 池 分 配 以 0 填充 的 私有 内 存 块 
mem alloc system 从 默认 的 内 存 池 分 配 系统 内 存 块 
mem alloc system from 从 指定 内 存 池 分 配 系统 内 存 块 
mem alloc system zero 从 默认 内 存 池 分 配 以 0 填充 的 系统 内 存 块 
mem alloc system zero from 从 指定 内 存 池 分 配 以 0 填充 的 系统 内 存 块 
_mem_copy 复制 某 位 置 的 内 存 数据 到 其 他 位 置 
mem create pool 在 默认 内 存 池 之 外 生成 内 存 池 
— 追加 额外 的 内 存 给 默认 内 存 池 ; 附加 的 内 存 必 须 在 当前 默认 内 存 池 之 外 ,但 不 必 
ies 与 其 邻接 
nmt mcer E E Ne 
mem free 释放 默认 内 存 池 内 、 外 的 内 存 块 
mem free part 释放 部 分 内 存 块 (如 果 内 存 块 比 申请 的 大 ， 或 者 比 需求 的 大 ) 
mem get error 获取 使 用 mem  test() 函数 产生 错误 时 指向 内 存 位 置 的 指针 
mem get error pool 获取 使 用 mem test. pool() 函数 产生 错误 时 指向 内 存 位 置 的 指针 
mem get highwater 获取 默认 内 存 池 分 配 的 内 存 块 的 高 位 地 址 (尽管 可 能 已 经 被 释放 ) 
mem get highwater pool 获取 已 分 配 内 存 池 的 高 位 地 址 (尽管 可 能 已 经 被 释放 ) 
mem get size 获取 内 存 块 的 大 小 ， 其 大 小 可 能 大 于 申请 值 
mem swap endian 转换 为 其 他 端 格式 


测试 默认 的 内 存 池 ; 即 检 查 内 部 校 验 人 码 以 确定 内 存 完整 性 是 否 被 破坏 (通常 被 破 


-mem 16s! 坏 是 由 于 应 用 程序 写 内 存 块 出 界 ) 

mem test and set 测试 并 设置 内 存 位 置 

_mem_test_pool 测试 内 存 池 的 错误 ， 参 见 _mem_test0 
mem teniet 转交 内 存 块 所 有 权 给 另 一 任务 


mem zero 设置 全 部 /部 分 内 存 块 为 全 0 


7.5 中断 处 理 


MQX 使 用 ISR 来 处 理 硬件 中 断 和 异常 。ISR 并 不 是 一 个 任务 ， 而 是 一 个 能 快速 响应 硬件 中 断 和 异常 事件 的 高 边 的 短 例 程 。ISR 通 弟 是 
用 C 语 言 编写 的 。1SR 的 任务 包括 : 维护 设备 ; 清除 错误 环境 ; 调度 一 个 任务 。 


当 MQX 调 用 一 个 ISR 时 ， 它 将 传递 一 个 由 应 用 程序 定义 的 参数 ， 然 后 应 用 程序 安 六 ISR。 例 如 ， 该 参数 可 能 是 指 同 一 个 具体 设备 配 
置 结构 的 指针 。 


注意 : 该 参数 不 能 是 指向 任务 堆栈 的 数据 ， 因 为 这 部 分 内 存 对 于 ISR 可 能 是 不 可 访问 的 。 


由 于 中 断 服 务 优 移 级 的 不 同 ，ISR 可 能 会 蒜 用 中 断 。 因 此 ，1SR 执 行 一 个 最 小 数量 的 阔 数 是 十 分 重要 的 。1SR 通 弟 会 使 任务 处 于 融 绪 
状态 ,任务 的 优先 级 决定 了 对 来 自 中 断 设备 信息 的 处 理 边 度 。1SR 有 多 种 方法 使 得 任务 处 于 就 绪 状 态 : 事件 、 轻 量 级 信号 量 、 信 和 号 量 、 
消息 或 者 任务 队列 。 


MQX 提 供 了 一 个 用 汇编 语言 编写 的 ISR 内 核 ， 这 个 内 核 会 在 其 他 任何 ISR 运 行 之 前 运行 ， 并 完成 如 下 任务 : 
- 保护 活动 任务 的 现场 。 

: 切换 到 中 断 堆 栈 。 

- 调用 合适 的 ISR。 

: 当 ISR 返 回 后 ， 恢 复 具 有 最 高 优先 级 的 就 绪 任 务 的 现场 。 


当 MQX 局 动 后， 会 为 所 有 可 能 的 中 断 浅 载 默认 的 ISR 内 核 ( int kernel isr)) 。 当 ISR 返 回 到 ISR 内 核 后 ， 如 果 此 时 ISR 有 一 个 处 于 
就 绪 状 态 的 、 优 先 级 更 高 的 中 断 任务 ，ISR 内 核 束 会 进行 任务 调度 。 这 将 意味 着 前 一 个 活动 任务 的 现场 将 被 存储 起 来 ， 而 更 高 优先 级 的 
任务 则 成 为 当前 的 活动 任务 。 如 图 7-6 所 示 为 MQX 处 理 中 断 过 程 。 


最 后 一 个 用 户 ISR 


图 7-6 ”中断 处 理 过 程 


7.6 MOXA 


MQX 可 以 同 某 些 功能 一 起 编译 ， 可 以 通过 改变 实时 编译 配置 选项 值 来 包含 或 者 移 除 这 些 功能 。 如 果 改 变 了 某 些 配置 的 值 ， 必 须 重 
编译 MQX 并 将 它 与 目标 应 用 程序 链接 。 由 于 BSP 库 文 件 也 可 能 依赖 于 一 些 MQX 配 置 选项 ， 因 此 它 必须 被 重新 编译 。 和 BSP 相 类 似 ， 也 
有 其 他 的 代码 组 件 使 用 MQX 操 作 系统 服务 ， 例 如 ，RTCS、MFS、USB， 因 此 在 MQX 和 BSP 之 后 也 要 对 这 些 组 件 重新 编译 。 


7.7 小 结 


本 章 深 入 分 析 了 微 内 核 结构 的 组 成 和 优 缺 点 ， 从 核心 组 件 和 可 选 组 件 两 万 面 展示 MQX 的 微 内 核 结构 组 成 和 各 组 件 的 功能 ， 总 结 
MQX 的 任务 模板 列表 、 任 务 状态 转换 、 任 务 切 换 过 程 和 任务 管理 的 相关 函数 ， 并 详细 介绍 了 MQX 内 核 的 存储 管理 功能 、 中 断 管理 功 
能 ， 从 信号 量 、 事 件 、 互 奈 、 消 息 和 任务 队列 等 万 面 讲解 了 MQX 的 任务 同步 和 通信 机 制 的 实现 。 


第 8 草 ARC EM Starter Kit FPGA 开 友 板 


本 章 主 要 介绍 ARC EM Starter Kit FPGA 开 发 板 ， 它 为 用 尸 提 供 了 一 个 低 成 本 、 多 用 途 的 解决 方案 ， 用 户 可 以 使 用 开 友 板 进 行 快速 
的 软件 开发 、 代 码 移 植 和 软件 调试 ， 并 可 以 对 ARC EM4 和 ARC EM6 处 理 器 内 核 硬件 进行 评估 与 分 析 。 


8.1 概述 


ARC EM Starter Kit FPGA 开 上 友 板 如 图 8-1 所 示 ， 其 开 友 套件 包括 硬件 平台 和 软件 包 。 硬 件 平 台中 预 安 和 了 不 同 配置 ARC EM 处 理 
器 的 FPGA 映 像 ， 软 件 包 包含 二 进 制 格式 的 MQX 实 时 操作 系统 、 外 设 驱 动 程序 和 应 用 程序 的 代码 示例 。 


图 8-1 ARC EM Starter Kit FPGA 开 发 板 


ARC EM 开 友 板 主 要 包含 两 个 部 分 : 

- 赛 灵 思 Spartan-6 的 FPGA 核 心 子 板 

` 包含 拓展 连接 器 以 及 外 设 的 底板 

板 上 包含 以 下 板 载 外 设 : 

10/100/1000 Gbit 以 太 网 收发 器 (PHY) 
.2X16 比 特 位 宽 1Gbit (128MB) 的 DDR3 SDRAM 
- 128Mbit (16MB) SPI Flash 存 储 

S SD 读 卡 器 

PEAR 

-LED 指示 灯 

- DIPA F A 

-可 供 设备 扩展 的 Pmod 连 楼 器 

. 通过 USB 线 缆 连 接 的 调试 并 AG 和 串口 


标准 的 20 引 脚 的 JTAG 连 接 器 (支持 4 线 JTAG) o 


8.2 ARC EM FPGA 系 统 设计 


8.2.1 FPGA 


ARC EM 开 上 友 板 FPOA 核 心 子 板 实现 了 一 个 基于 ARC EM 处 理 器 的 SoC 系 统 ，FPGA 系 统 结 构 如 图 8-2 所 示 。ARC EM4/EM6 内 核 通 
过 AHB 忌 线 连 接 到 DDR3 内 存 控制 器 (只 有 EM6 内 核 才 配 有 该 内 存 控制 器 ) 进行 取 指 和 数据 访问 ， 外 围 设备 GPIO (通用 输入 输出 ) 、 
UART (串口 ) 、I<C、SPI 主 机 和 SPI 从 机 控制 器 则 通过 高 性 能 的 外 围 总 线 (APB) 和 ARC EM 内 核 相 连 ， 所 有 外 设 控 制 器 的 52 个 I/O 口 
通过 pinmux 控 制 器 进行 引 脚 复 用 后 连接 到 板 上 Flash、SD 卡 接口 、Pmod 接 口 等 。 另 外 开发 板 还 提供 了 JTAG/VUART-to-USB 转 换 接 
口 ， 用 户 仅 用 一 根 USB 续 将 开 上 友 板 与 调试 上 位 机 PC 相连 ， 便 可 以 进行 ARC 几 AG 连 接 和 串口 打印 调试 。 


128MB DDR3 RAM USB 


( 仅 针对 EM6 ) 


JTAG 和 USB JIAG 调试 控制 Zs 


pu [BU 
EM4/EM6 


( {ET XTEMG ) 


DBU 


APB 


| ， 从 SPI ( 仅 
IMS ) 
il spia sp: 
52 VO (HOPING E Be HT LAT N X ERE) 


图 8-2 ” FPGA 系统 结构 


8.3” 开 友 板 的 使 用 


8.3.1 开 友 板 上 接口 介绍 


1.JTAG 连 接 器 


FF A al ES WS AU SBE SRIATARC EM 内 核 上 TAG 的 连接 ， 或 者 也 可 以 使 用 行业 标准 的 20 针 JTAG 连 接 器 上 1 5 进行 连接 调试 。 本 
TEARS SC REENEPUZEJTAGEZLI, ASSeRIPAZSRJIEEE 1149.7C JTAG., 


2.USB 


Mini-USB 端 口 可 以 用 于 以 下 几 个 目的 : ARC JTAG 调 试 端口 ; UART 调 试 串口 ; FPGA bit 文 件 编程 。 
当 进 行 FPGA 编 程 时 ， 把 跳 线 J8 置 位 ; 当 USB 端 口 被 用 来 ARC JTAG 调 斌 或 者 作为 UART 调 试 控制 全 的 时 候 ， 需 要 移 除 跳 线 。 


3.SD-F 


SD 卡 接口 工作 在 SPI 模 式 ， 它 和 SPI 主 机 控制 器 连接 ， 开 友 板 软件 包 包含 SD 卡 原始 工作 模式 的 MQX 应 用 。 
4. 人 机 交互 接口 


该 开 上 友 板 包含 以 下 人 机 接口 : 按键 、DIP 开 天、LED 灯 和 电源 接口 。 
(1) 按键 
如 表 8-8 所 示 列 出 了 按键 相关 的 信息 ，A、L、R 控 键 可 以 家 用户 使 用 。 
表 8-8 按键 位 置 及 功能 描述 


按键 名 f X 

当 处理 需 停止 工作 时 ， 该 按钮 用 作 局 动 。 此 外 ， 这 个 按键 连接 到 DW 
GPIO 的 A[2] 端口 ， 去 抖 功能 在 DW GPIO IP 内 实现 。 注 意 : 当 处 理 顺 
A 在 ARC 标志 的 A 上 方 停止 工作 (例如 正在 debug)， 按 该 按键 会 继续 执行 ， 在 调试 模式 下 ， 需 
更 格外 注意 该 按键 。 在 普 通 模式 下 ， 该 按键 用 于 应 用 程序 ， 功 能 和 工 、 
R 按键 类 似 


Reset 在 ARC 标志 的 及 上方 ARC 复位 按键 
p MATE, TAFE PEAT FRE APE DE, TH FPGA 从 

C 在 ARC 标志 的 C 上 方 | Rc BL Bere P BET Al RARE 4 EJIRE, JF ALS ih \ 
闪存 中 重新 载 入 bit 文件 

7 用 户 按键 。 该 按键 和 DW GPIO 端口 A[0] 连接 。 在 GPIO IP 内 部 实现 
SABIE 

^ 用 户 按 键 。 该 按键 和 DW GPIO 端口 A[1] 连接 。 在 GPIO IP 内 部 实现 
三 去 抖 功能 

(2) DIP 开 关 


4 位 的 DIP 开 关 SW1 被 用 于 如 下 目的 : 
1) 针对 用 户 GPIO 来 控制 输入 端口 。 
- Switch1 324% s] GPIO 35 v? 85 C[0] 

. Switch2 #4 8] GPIO 32 7 85C[1] 

. Switch3 #4 8] GPIO 3$ v 85 C[2] 

. Switch4 #4 2] GPIO 35 7 85C[3] 


2) 在 上 电 后 ， 选 择 要 加 载 的 预定 义 的 FPGA 映 像 。 


3) 允许 运行 目测 试 应 用 程序 (Switch3) 。 
4) ASPI Flash (Switch4) 运行 用 户 应 用 程序 。 
(3) LED 


一 共有 9 个 LED 可 以 被 用 来 当 作 输 出 端口 ，LED0 到 LED8 在 开 友 板 上 位 于 ARC 标 志 的 正 下 方 ，LED8 位 于 DIP 9witch 开 天 sw1 的 劳 


s 


LED GPIO 了 映射 如 下 : 
- GPIO Port B[0] 控 制 LED0 
- GPIO Port B[1] 控 制 LED1 


- GPIO Port B[8] 控 制 LED8 


如 果菜 个 LED 旺 现 点 亮 状 态 ， 那 么 相应 的 控制 位 被 置 低 电 平 。 在 重启 之 后 ，LED 灯 显示 的 是 当前 被 选 择 的 ARC EM 核 配 置 以 及 显示 
目测 试 的 结果 。 
(4) 电源 


该 开发 板 使 用 的 是 位 于 开发 包 中 的 通用 电源 适配器 (110V~240V 交 流转 5V 直 流 ) ， 把 交流 插头 连接 到 合适 的 交流 插座 上 ， 然 后 将 
直流 插头 连接 到 板 上 的 J135V DC 连接 器 上 ， 最 后 把 直流 插头 连接 到 直流 插座 上 即 可 。 


8.4 实例 


在 本 节 中 ， 演 示 一 个 基于 Bare Metal 的 ARC EM Starter Kit 点 亮 LED 的 示例 。 在 未 配置 操作 系统 的 ARC EM Starter Kit 开 发 板 上 本 
置 EM 处 理 器 的 Timer0 定 时 器 ， 通 过 中 断 进行 精确 定时 。 主 程序 根据 定时 情况 控制 板 载 Led0~Led7 的 点 亮 和 关闭 ， 实 现 跑马 灯 功 能 
(Led0~Led7 循 环 点 亮 ) 。 本 实例 的 运行 流程 简 图 如 图 8-14 所 示 。 


Timer0 用 于 定时 产生 中 断 ， 由 0 开始 计数 ， 当 计数 达到 设 定 值 后 产生 Timer0 中 断 ， 设 定 标志 位 timer0_ count 通 知 main 函 数 中 的 主 
循环 点 亮相 应 的 LED。 在 EM4 中 Timer0 的 工作 频率 为 35MHz， 在 EM6 中 为 30M Hz。 


实现 上 述 操作 的 主 程序 代码 如 下 (flashing leds.c) : 


Uartsgpio 初 始 化 
打印 局 动 信息 ， 关 闭 所 有 LED 灯 


Timer0 初 始 化 

KAAS? Wr Timer0 中 断 服务 程序 
使 能 Timer 中 上 断 功 能 中 晰 标志 timer0_count++ 
设置 Timer 计 数 上 限 ， 清 0 计数 痢 
挂 接 Timer 中 断 服 务 程序 至 16 号 中 贿 


flash. count 10 


退出 
Timers ^E FR Wr 
T 


TH ER PT ERtimerO. count 
内 灯 次 数 flash_count 加 1 


| - flash. count»100 关 挥 有 所 有 LED 灯 
(OX 打印 退出 信息 


根据 当前 闪 灯 次 数 flash_count 点 亮 对 应 LED 


图 8-14 ”程序 流程 图 


JJ ike EER ERE ERR ESS EER SEER EE EAE ER SEER EE ARPES SEES RE RAE RSA RE / 
// ERVE A 

J ORI REKREA KERR ke KOKOIOKk IORI CIO I ICICI IORI I IORI I ROR I A A KK j 
int main(int argc, char *argv[]) 4 


int unsigned flash count = 0; 

// 工 .获取 硬件 资源 地 址 

DWCREG PTR pctr = (DWCREG PTR) (DWC GPIO 0 | PERIPHERAL BASE); 
DWCREG PTR uart = (DWCREG PTR) (DWC UART CONSOLE | PERIPHERAL BASE); 
// 2.399354 ,gpio/uart 

gpio init (pctr); 


uart initDevice(uart, UART CFG BAUDRATE 115200, UART CFG DATA 8BITS, UART CFG 1STOP, UART CFG PARITY NONE); 
// 3. 打 印 暂 时 信息 
uart print (uart, "UNDNEA KKK KKK KK KK KKK KK KK KK e Nn pn 


); 
uart print (uart, Ne ARC EM Starter kit v1.1 x\n\r"); 
uart print (uart, TA Flashing leds demo "imp s 
üert print(uart, WKKKKKKKKKKKKKKKK KKK KKK KKK KKK KKK NnN EU) ; 


// 4.38 BFA LED 
leds = Oxlff; 
gpio set leds(pctr, leds); 
// 5. 设 置 定 时 计数 器 周期 为 0.2s = 6M(0x5B8D7f) / 30M 
tlmerÜ init (Oxsbe8d/i) ; 
// 6. 循 环 点 亮 或 熄灭 LED 
while (1) 
{ 
if (timer0 count > 0) // 产生 新 的 定时 器 0 中 断 
{ 
timerO count = 0; 
flash count++; 
// 最 后 3 位 对 应 8 个 发 光 二 极 管 
leds = Oxlff & (~(0x01<<(flash_ count & 0x07))); 
gpio set leds(pctr, leds); // 点 亮 或 熄灭 相应 的 LED 
} if (flash count > 100) break; 
} 
leds = Oxlff; 
gpio set leds(pctr, leds); 
üart prinE(uart, "ke Bie Q xeu 
return 0; 
} 
void timerO init (unsigned int max count) 


{ 


cali exis Oy // 关 闭 中 断 

_sr(IE | NH, TIMERO CONTROL); // 定 时 器 中 断 使 能 

_ Sr (max count, TIMERO LIMIT); // 停 止 前 的 最 大 计数 
sr (0, TIMERO COUNT); // 复 位 定时 器 


// X&Xvector — 

 Setvecti(TIMERO VECTOR, TIMERO ISR); 
// 使 能 ints 及 优先 级 别 2、1、0 

Seti INT CIBL LE | PRIORITY2); 


当 Timer0 计 数 到 达 限 定 值 (LIMIT0) 之 后 ， 进 入 中 断 向 量 号 为 16 的 中 断 服务 子 程序 ， 代 码 如 下 : 


#pragma Code ("timer int") 
 Interrupt void TIMERO ISR (void) 
i 


timerO0 countt+; 

 Sr(IE | NH, TIMERO CONTROL); // 清 除 中 断 挂 起 
} 
#pragma Code () 


此 中 断 服 务 子 程序 对 变量 timer0_count 进 行 了 递增 操作 ， 并 对 Timer0 的 控制 寄 仓 器 |E 域 进行 了 清 中 断 处理 。 
最 后 简要 阐述 如 何 使 用 软件 包 中 的 gmake 命 令 来 编译 、 运 行 和 调试 应 用 实例 : 
1) 局 动 cmd 命 令 行 并 进入 MO 库 目录 ， 编 译 所 有 外 设 驱 动 。 


gmake 


2) 进入 LED 实 例 目录 ， 编 译 源 文件 。 


gmake clean all 


3) 编译 生成 elf 可 执行 文件 后 ， 运 行程 序 。 


使 用 mdb 命 令 行 模式 运行 程序 : 


gmake run 


使 用 mdb 图 形 界面 GUI 模 式 运 行程 序 : 


gmake gui 


8.5 小结 


本 草 中 ， 首 先 在 硬件 万 面 介绍 了 ARC EM Starter Kit 开 上 友 板 套件 中 所 包含 的 内 容 (底板 、 传 感 器 等 ) ， 软 件 万 面 介绍 了 该 套件 中 所 
BARE ( 裸 机 程序 和 市 操作 系统 的 应 用 程序 ) 。 其 次 ， 对 开 友 板 进 行 了 细致 的 阐述 ， 包 括 开 友 板 所 包含 的 外 设 、 外 设 控制 器 等 ， 同 
时 也 前 述 了 Pmod 的 配置 和 连接 、 各 类 外 设 在 底板 上 的 连接 情况 、 不 同 EM 核 的 不 同 配 置 情况 。 青 次 ,介绍 了 开 友 板 (ARRIER, 
不 同 的 操作 模式 下 的 使 用 ) 使 用 万 法 ， 并 且 使 用 包 机 和 市 操作 系统 的 应 用 程序 例子 巩固 了 开 友 板 的 使 用 。 最 后 ， 用 一 个 综合 实例 让 读者 
熟悉 利用 ARC EM Starter Kit 开 友 板 开发 应 用 程序 的 完整 流程 ， 擎 握 对 开发 板 上 不 同 外 设 的 使 用 (LED 点 之 和 中 断 的 使 用 ) 。 


下 一 章 将 介绍 一 应 用 程序 实例 ， 让 读者 于 加 熟悉 ARC 内 核 ， 并 利用 ARC EM 核 、 开 发 板 、 开 发 工具 来 进行 以 后 的 散 入 式 开 上 友 工 作 。 


第 9 章 ” 开 上 友 实 例 : 温度 监测 与 显示 


第 8 章 详细 介绍 了 ARC EM Starter Kit FPGA 开 上 友 板 的 相关 内 容 ， 本 章 将 通过 一 个 综合 开 友 实例 ， 系 统 介 绍 如 何 基 于 synopsys ARC 
EM 处 理 器 进行 散 入 式 开 友 。 


9.1 系统 简介 


众所周知 ， 科 学 合理 的 温 湿度 环境 在 工业 生产 、 运 输 、 和 存储 等 环 证 的 质量 安全 万 面 已 处 于 一 个 十 分 重要 地 位 。 为 此 ， 基 于 ARC EM 
处 理 器 开发 一 蒜 温 度 目 动 监测 终 记 模 块 ， 实 时 监测 环境 温度 ， 并 且 对 采集 的 数据 进行 综合 管理 。ARC EM 处 理 器 具有 最 优 的 性 能 功 耗 
比 ， 且 面积 开销 小 ， 满 足 传感器 网 络 无 线 传输 、 低 功 耗 、 低 成 本 、 分 布 式 和 目 组 织 等 特点 ， 适 用 于 温度 监测 终 疹 系统 。 


本 章 将 重点 系统 地 介绍 如 何 基 于 ARC EM Starter Kit 开 友 板 来 设计 一 款 温 度 目 动 监测 模块 。 该 模块 采用 了 两 个 外 设 模块 (Pmod) 
来 进行 温度 数据 的 采集 和 显示 ，ARC EM 处 理 器 进行 系统 采集 数据 的 综合 处 理 。 同 时 本 章 附 有 开 友 板 软 件 包 包含 该 实例 源码 。 


基于 ARC EM Starter Kit 开 发 板 的 实时 温度 目 动 监测 模块 结构 如 图 9-1 所 示 。 


ARC EM Starter Kit fF 
ARCA 
DDR3 


USB 
DUET 


GPIO 


图 9-1 基于 ARC EM Starter Kit 的 实时 温度 自动 监测 模块 框图 
本 实例 要 实现 的 功能 如 下 : 
- 实时 监测 外 界 温度 ， 并 能 提供 华 色 度 和 摄氏 度 两 种 显示 方式 。 
在 标准 输出 设备 (上 位 机 串口 终端 ) 上 分 别 输出 两 种 计量 方式 的 实时 温度 。 
: 在 LCD 显 示 屏 上 分 别 输 出 两 种 计量 方式 的 实时 温度 。 


. 可 通过 板 上 按钮 或 上 位 机 进行 人 机 交互 。 


9.2 系统 硬件 设计 


为 了 实现 上 述 功 能 ， 本 实例 采用 一 个 高 精度 的 温度 传感器 模块 Pmod TMP2 来 获取 环境 温度 ， 通 过 |“<C 串 行 总 线 把 原始 数据 传递 给 
ARC EM 处 理 器 。 


一 方面 是 通过 串口 传递 给 上 位 机 ， 


dn 


温度 传感器 采集 而 得 的 原始 数据 有 两 个 用 途 ， 一 方面 是 在 温度 目 动 监测 模块 上 面 实时 的 显示 ， 
(TSS SIA. 


基于 ARC EM Starter kit 开 友 板 目 市 多 个 Pmod 扩 展 口 ， 可 以 方便 地 扩展 功能 ， 选 用 LCD 显 示 屏 模块 PmodCLs 负 责 在 温度 目 动 监测 


模块 上 显示 当前 温度 。 


另外 ，ARC EM Starter kit 开 友 板 上 两 个 按键 和 上 位 机 的 键盘 ， 可 以 实现 与 温度 目 动 监测 模块 的 人 机 交互。 


93 ”系统 软件 实现 


1 


软件 开发 可 分 为 底层 驱动 开发 和 应 用 层 程 序 开 发 。 底 层 驱 动 开发 主要 是 针对 UART 驱 动 、12C 驱 动 、SPI| 驱 动 、GPIO 驱 动 以 及 LCD 驱 
动 开展 底层 级 驱动 层 和 1O 级 驱动 层 的 开发 工作 ; 应 用 层 软件 开发 主要 是 实现 预期 的 功能 ， 涉 及 UART、GPIO 和 定时 器 中 断 子 程序 ， 使 得 


整个 系统 能 文 持 多 个 Pmod 模 块 。 
首先 是 底层 驱动 的 开 肥 ， 系 统 底层 驱动 主要 包 合 : 
- I*C 了 驱动 ， 采 集 Pmod TMP2 板 数据 。 
. GPIO 终 端子 程序 和 了 驱动， 控制 系统 开关 及 显示 模式 。 
: LCD 了 驱动 和 SPI 了 驱动 ， 显 示 温 度 信息 至 LCD 屏 上 。 
- UART 终 端子 程序 和 驱动， 上 位 机 显示 温度 信息 。 


有 了 这 些 驱 动 ， 主 程序 整 可 以 方便 地 调用 对 应 的 沙 数 来 实现 这 些 功能 ， 比 如 有 了 12C 驱 动 ， 在 主 程序 中 调用 
i2c init (i2c, 12C STANDARD SPEED, I?C SLAVE ADDRESS) ;进行 1<C 的 初始 化 ， 然 后 调用 
i2c read (i2c, buf, 2, TIMEOUT) ; 惑 可 以 将 Pmod TMP2 采 集 的 温度 原始 数据 传 入 buf 数 组 内 ， 接 下 来 的 代码 就 能 对 获取 到 的 温 
度数 据 进 行 下 一 步 的 处 理 。 


同 理 ， 为 了 实现 SPIl 通 信 、LCD 显 示 、UART 通 信 等 功能 ， 就 必须 有 对 应 的 驱动 程序 支持 。 


应 用 层 软件 的 开 上 友 是 与 本 实例 的 具体 功能 索 密 结合 在 一 起 的 。 比 如 为 了 监测 温度 目 动 监测 模块 是 否 正音 运 行 ， 需 要 用 定时 器 的 中 断 
子 程序 控制 一 个 LED 灯 闪 灶 。 在 实际 应 用 场景 中 ， 应 用 层 开 友 需要 温度 目 动 监 测 模块 实现 如 下 功能 : 


1) 心跳 功能 ， 用 一 个 LED 灯 的 内 炸 来 标识 系统 是 否 正 党 运行 。 

2) 获取 温度 功能 ， 处 理 传感器 读 取 的 数据 ， 计 算 摄氏 /华氏 温度 。 
3) 开 友 板 按 键 功能 ， 在 LCD 屏 、 上 位 机 切换 摄氏 /华氏 温度 显示 。 
4) 键盘 控制 功能 ， 上 位 机 对 温度 目 动 监 测 模 块 的 直接 控制 。 


软件 层次 结构 图 如 图 9-6 所 示 。 


UART 驱 动 | |12C3K 25] SPI 驱 动 


t t n 
IARTO|UARTI| | TEMP2| LCD 


图 9-6 ”实时 温度 监测 系统 软件 层次 结构 图 


实时 温度 目 动 监测 模块 软件 开 友 目 顶 向 下 的 流程 图 如 图 9-7 所 示 。 系 统 上 电 对 所 有 控制 器 和 外 设 初 始 化 ， 包 括 LCD 屏 、Timer、 
UART 和 GPIO 中 断 子 程序 。 实 时 监测 到 温度 传 感 信息 之 后 将 相应 华氏 或 者 摄氏 温度 输出 在 LCD 和 终端 中 。 


开始 


初始 化 : 

1. Pmod 复 用 需 / 连 接 需 连接 至 PMODs 

2. PCT md 

3. SPHA dila 

4. GPIO ( 设 led 状 态 ) AIBC HR ST 
Timer ( 定时 器 ) PIT 5. SPI 上 的 LCD 屏 


每 1000 个 CPU 周期 对 应 的 值 加 1: 6. UART 中 上 断 
timer0_isr_cnt++; 7. Ac E timer” Wr 


timer_isr_cnt++; 


10. 打印 startup 信 息 


初始 化 maln_loop 程 序 stop 一 0; 


UART 中 断 清除 LCD 屏 信息 
从 终端 中 接收 信息 m 关闭 timer 
( 在 mian_loop 程 序 中 处 理 信息 ) 一 so- > 准备 推出 
关闭 LED 灯 
yes 


GPIO: AF 当 timer0_isr_cnt 值 大 于 4 时 
当 板 级 按键 按 一 次 ， 监测 UART 序 列 并 接收 信息 
1 — Yr 
Eom] 检查 CPIO 中 断 产 生 的 gpio_isr_ cnt1 和 gpio_ 
golo isr cntl: 'L' ES isr_cnt2 计 数值 。 设置 时 这 些 值 随 痢 FE LEK 
eoio_isr_cnt2: ‘R’ 按键 者 R 键 而 递增 。 并 且 ILVR 键 分 别 代 表 TMP2 
goio jer ons ‘A’ Seat 模块 实时 监测 到 温度 的 华氏 /摄氏 值 


终端 处 理 接 收 到 的 信息 : 

'C’, 'e' -显示 摄氏 温度 值 

'F' ，'f' -显示 华氏 温度 值 

'S', 's' SEI (stop=1 ) 

'1 -清除 LCD 屏 

'2' -在 LCD 屏 上 显示 startup 信 息 


图 9-7 实时 温度 监测 软件 流程 图 


9.4 调运 与 运行 


9.4.1 选择 FPGA 映 像 


ARC EM Starter Kit 开 发 板 上 拨 码 开关 SW1 的 pin1 和 pin2 用 于 FPGA 了 映像 的 选择 。 在 本 实例 中 ， 选 择 的 内 核 为 ARC_ EM4， 即 pin1 
和 pin2 都 处 于 OFF 状 态 。 


9.5 小结 


ANI — PRG SLGITTZBARC EM Start Kit 开 友 板 的 使 用 ， 实 例 中 用 到 了 GPIO、UART、TIMER、TemperSensor 和 LCD 等 模 
块 。 


本 草 首 先 对 温度 检测 系统 进行 了 概述 ， 然 后 介绍 了 实现 整个 系统 所 需要 的 硬件 及 配置 和 连接 方式 。 接 下 来 分 析 了 软件 结构 ， 包 括 软 
件 层次 结构 图 和 软件 流程 图 ， 给 出 了 样 例 代码 ， 实 现 了 各 模块 的 相应 功能 ， 并 对 其 中 的 关键 部 分 进行 了 详细 的 注解 。 最 后 人 简要 讲解 了 调 


试 运行 步骤 和 运行 结果 。 


希望 通过 本 章 的 设计 实例 ， 能 让 读者 在 实际 操作 中 熟悉 ARC EM Start Kit 的 开发 流程 ， 了 解 ARC EM 处 理 器 的 基本 使 用 方法 。 


第 10 草 ”ARC EM 可 配置 性 


假设 需要 去 一 家 超市 购买 ? 升 牛奶 ， 但 是 店 里 提供 的 只 有 3 升 和 7 升 这 两 种 包 妆 ， 则 我 们 实际 的 需求 不 能 铸 非 钊 准确 地 满足 。 市 场 上 
提供 的 东西 岂 会 引入 额外 的 成 本 ， 多 一 后 花 费 ， 或 者 多 一 点 时 间 ， 诸 如 此 类 。 或 计 会 想 如 果 所 有 的 货物 都 可 以 被 定制 为 刚好 符合 目 己 需 
要 的 模样 ， 而 不 用 有 其 他 浪费 ， 那 就 堪 称 完美 了 。ARC EM 处 理 器 就 刚好 具有 这 样 的 定制 特性 ， 称 为 可 配置 性 。 


本 章 将 讨论 EM 处 理 器 的 可 配置 性 属性 ， 并 介绍 如 何在 处 理 器 设计 中 利用 这 种 可 配置 性 实现 优化 设计 。 以 Cache 及 硬件 乘法 器 为 例 
襄 明 可 配置 的 程度 及 软 硬 件 协同 工作 的 原理 ， 同 时 会 比较 可 配置 处 理 器 与 固定 配置 处 理 器 在 具体 设计 时 具有 的 相对 优势 。 


10.1 可 配置 性 优点 


ARC EM 处 理 器 的 可 配置 性 具有 两 个 基本 含义 : 首先 处 理 器 提供 各 种 不 同 的 基准 模板 ， 这 些 模 板 以 ARC EM4 或 者 EM6 处 理 器 为 中 
心 ， 或 者 使 用 其 他 类 型 ARC 处 理 器 ， 包 含 一 系列 具有 多 种 可 配置 特性 的 模块 。 其 次 ， 可 以 根据 最 终 应 用 需求 增加 需要 的 硬件 加 速 模块 ， 
或 者 删除 模板 中 不 需要 的 模块 ， 这 样 构造 一 个 适用 于 特定 应 用 的 ， 具 有 独一无二 结构 ， 而 且 模 块 属性 也 是 针对 最 终 应 用 而 优化 的 处 理 
器 。 


这 种 可 配置 性 给 设计 市 来 了 很 大 的 灵活 性 ， 其 优势 主要 体现 在 : 


` 处 理 器 是 针对 特定 应 用 而 进行 优化 的 ， 删 除 无 用 的 硬件 资源 ， 以 减少 最 终 芯 片面 积 、 降 低 功 耗 ， 在 不 影响 性 能 的 条 件 下 降低 了 成 


在 软件 实现 菜 些 应 用 的 时 候 ， 如 果 不 能 满足 应 用 要 求 ， 可 以 使 用 相关 的 硬件 资源 进行 加 速 。 


已 经 经 过 产业 化 验证 的 心 片 结构 在 后 续 升 级 时 只 需要 经 过 很 小 的 改动 即 可 以 投入 使 用 ， 重 用 率 得 到 提高 ， 从 而 减少 了 再 次 开 友 难 
度 ， 加 快 了 产品 上 市 时 间 。 由 于 核心 结构 不 变 ， 却 可 以 通过 增加 功能 模块 的 方式 来 提高 处 理 器 处 理 能 力 ， 处 理 器 也 不 会 由 于 无 法 适应 应 
用 的 改变 而 过 快 被 淘汰 。 对 于 深 垦 入 式 应 用 (如 物 联网 ) ， 由 于 仪 仪 需要 一 些 最 基本 的 接口 ， 可 以 使 用 这 种 配置 性 来 极 大 地 减 小 功 耗 。 


但 是 无 论 使 用 何 种 结构 ， 在 面积 、 功 耗 和 性 能 之 间 的 综合 考虑 始终 是 在 处 理 器 结构 设计 时 不 能 回避 的 问题 。 


10.2 基准 模板 


配置 ARC EM 处 理 器 的 软件 是 ARChitect， 是 由 synopsys 公 司 开 友 的 ARC IP 提 取 工 具 。 该 工具 可 以 接收 包含 处 理 器 信息 的 IP 库 和 包 
含 参 考 设计 信息 的 IP 库 (RDF IP library) 作为 输入 ， 根 据 使 用 者 要 求 配置 后 输出 相关 处 理 器 的 RTL 和 基本 功能 测试 代码 。 


首先 需要 设置 ARChitect 的 输入 IP 库 ， 步 又 如 下 。 

1) 启动 ARChitect 软 件 (GUI) : 在 cmd 命 令 行 中 输入 ARChitect2。 
2) 选择 Project->Default Properties->Libraries->Add 按 钮 。 

3) 找到 库 所 在 的 位 置 ， 选 中 它们 并 完成 添加 步骤 。 


图 10-1 给 出 了 添加 完成 的 例子 。 所 有 的 库 中 有 一 个 master 库 ， 它 是 整个 处 理 器 的 核心 库 文件 ， 另 外 还 有 若干 扩展 库 文件 ， 属 性 为 


extension。 图 10-1 中 高 亮 的 部 分 是 一 个 master 库 文件 。 


4. Default Properties 


= == -E = = 


Environment ' General \ IP-XACT ` Libraries \ Output } 


Library Paths 


C:\ARC\CORE LIB\ARC_EM_? 0 _IP-Libraries\ARConnect_v1.1.7.iplib 

C:\ARC\CORE LIB\ARC_EM_? 0_IP-Libraries\ARCv2EM_v2.0.15.iplib \arcv2em\ip_library 
C:\ARC\CORE LIB\ARC_EM_? 0 IPAibrariesVARCv2EM v2.0. 15.iplib\cct\p_library | Remove | 
C:\ARC\CORE LIB\VARC EM 2 0 IPAibrariesVARCvZEM v2.0. 15.iplib implementation jp library | 


C:\ARC\CORE_LIB\ARC_EM_2 0 IP-libraries\ARCv2MSS_v1.1.8.iplib | Remove set | 


C:\ARC\CORE_LIB\ARC_EM_ 2 0 IP-Libraries\tool_configuration_v1.0.29.iplib 


Library Properties 


图 10-1 EM IP# 


添加 完成 后 ， 会 在 GUI 界面 的 左 侧 看 到 很 多 不 同 的 处 理 器 模块 。 如 图 10-2 所 示 是 explorer 栏 的 内 容 ， 其 中 Processor element 列 出 


一 系列 可 以 加 入 处 理 器 的 资源 ， 其 他 栏 中 的 模块 也 可 以 添加 到 处 理 器 外 围 结构 中 ， 以 提供 完整 的 仿真 环境 。 
添加 到 ARChitect 中 的 库 提供 很 多 预先 设置 好 的 基准 模板 。 点 击 File- > New Project 会 打开 一 个 新 的 对 话 框 ， 在 对 话 框 左 侧 会 看 到 


很 多 已 经 仓 企 的 模板 。 图 10-3 给 出 了 针对 前 面 添加 的 库 可 以 选择 的 模块 对 话 框 。 


可 以 选择 一 个 模板 ， 从 模板 提供 的 内 容 开始 处 理 器 的 设计 。 选 中 之 后 的 模板 会 补 高 襄 ， 该 模板 的 主要 特性 会 在 摘 述 选项 中 列举 出 
来 ， 如 图 10-3 所 示 。 在 图 10-3 中 选择 了 一 个 名 为 EM4_mini 的 基准 模板 ， 其 主要 特性 列举 如 下 : 


- 64KB 地 址 空间 


. 16 位 程序 计数 寄存 器 和 32 位 硬件 循环 计数 寄存 器 


.16 个 核心 寄存 器 


: 32KB 高 速 紧 耦 合 指令 和 数据 存储 


- AHB-Lite 存 储 总 线 


te) £ | | 
3. E E EM M M 


Components ‘ Build Build Sequence ` 


<4 Actionpoints (1.0) 

«A DCCM (1.0) 

\] <4 Data Cache (1.0) 

«^ Data Memory Initiator (1.0) 
«^ Debug Interface (1.0) 


€ Instruction Cache (1.0) 
«^ instruction Fetch Queue (1.0) 


«A interrupt Controller (1.0) 
«^ JTAG Interface (1.0) 
€^ Performance Monitor (1.0) 
|| <4 Real-time Counter (1.0) 
€^ Real-time trace producer (1.0) 


$4 UAUX Interface (1.0) 


图 10-2 ARChitect Exploret 栏 


New Project 


Create a new project 


A project directory will be created with the given name at the given location. 
The project will be based on the selected template. 


Mame: 


Location: 


Templates —————— — — — ——, -Template Summary 


em4_dmips Description | Topology Preview Y 

emá dmips fpusp 

em4 dmips fpuspdp em4 mint: Minimum-Featured EM4 Processor 
emá ecc 


ema emb5d plus l l l i 
This template features low die area and power consumption, and is suitable for 


em4_mini_plusx2 stand-alone sensor interfaces. 


em4_parity è 54 KB address space 

em5d mini è 16-bit program counter (PC) and 32-bit loop counter (LC) registers 
em5d mini. plusx2 € 16 core registers 

em5d nrg è 22 KB high-speed closely coupled memories for instructions and data 
em, dmips è AHB-Lite memory bus interfaces for data I/O 

embó mini 

emb_mini_plusx2 

em7d nrg 


图 10-3 ”基准 模板 对 话 框 


对 语 框 中 也 列 有 EM4_mini 这 个 基准 模板 适用 的 应 用 ， 访 模板 具有 很 小 的 面积 和 功 耗 ， 适 合 独立 传感器 接口 应 用 。 这 些 信息 有 助 于 
选择 更 适合 于 特定 应 用 的 基准 模板 。 


在 确定 了 基准 模板 之 后 ， 指 定 工 程 位 置 及 名 称 ， 单 击 Finish 按 钮 会 打开 新 工程 界面 ， 如 图 10-4 所 示 。 这 个 工程 基于 选择 的 
EM4_mini 模 板 而 建 。 


File Edit Project APEX View Help 
SHSG OH 6 XDA Bde 100% v] 
ister | ion \ | & Interrupt \ B Memory ` 2, Topology \ 


Components | Build \ Build Sequence | go View. 


Option Type: 


8 System 


Optic 


uge : es Simulator Name 

Island initiato c] Arbiter Target Slave Initiator “| Slave Target = 

64-bit support 
$* Data Memory Initiator 

$^ Data Cache (1.0) | et DCCM 

$^ Data Memory Initiator (1.0) | € Debug Interface 

$^ Debug Interface (1.0) | SA ICCMO 


$4 Interrupt Controller 


<A Instruction Cache (1.0) | 

sA Instruction Fetch Queue (1.0) | SSISRAMCt o 
<4 Interrupt Controller (1.0) [ nam 
$4 JTAG Interface (1.0) | Slave Initiator dd 


$4 Lockstep Interface (1.0) 

$^ Memory Protection Unit (1.0) 
sA Performance Monitor (1.0) 

sA Real-time Counter (1.0) 

sA Real-time trace producer (1.0) 
$4 SmaRT (1.0) 

<4 Timer 0 (1.0) 

sA Timer 1 (1.0) 

sA UAUX Interface (1.0) 

sA Watchdog Timer (1.0) 


- 


\ (T) Dependencies | & Search Results \ 


Sal System element 


图 10-4 EMA mini 基准 模板 工程 


需要 注意 的 是 ， 图 10-4 中 只 有 名 为 CPU 的 那 一 部 分 是 实际 配置 的 处 理 器 ， 外 围 总 线 及 相关 外 设 是 为 了 构建 一 个 完整 系统 而 生成 的 ， 
它们 是 仿真 系统 不 可 缺少 的 部 分 ， 但 是 不 是 CPU 设计 包含 的 内 容 。 在 参考 设计 流程 中 也 会 使 用 到 相 天 的 贷 源 。 


10.3 ”配置 模块 


10.3.1 添加 /删除 模块 


在 ARChitect 可 以 删除 一 个 已 经 存在 的 模块 ， 也 可 以 添加 工程 中 暂时 不 存在 ,但 是 在 IP 库 中 存在 ， 并 且 在 图 形 化 界面 中 显示 的 模 
块 。 在 最 终生 成 一 个 设计 之 前 ,该 设计 必须 是 完整 的 。 每 一 个 设计 称 为 一 个 Build， 如 果 某 些 关键 模块 缺失 ,会 在 代码 生成 阶段 报告 错 
误 ， 错 误 信 息 会 显示 在 Message 栏 的 Dependencies 选 项 卡 中 。ARChitect 也 有 不 同 的 视图 ， 系 统 设计 框 中 的 相关 视图 也 会 高 亮 这 些 错 
误 ， 如 果 不 进行 改正 ， 则 无 法 生成 需要 的 处 理 器 RTL 代 码 。 


在 Dependencies 视 图 中 ， 某 些 次 要 的 警告 信息 也 会 有 所 显示 。 
(1) 添加 模块 


模块 视图 会 显示 IP 库 文件 中 可 选 的 所 有 模块 ， 如 图 10-4 所 示 。 这 些 模块 会 根据 功能 列 于 不 同 的 类 型 之 下 ， 每 个 模块 只 对 应 一 种 类 
型 。 把 鼠标 停留 在 该 模块 之 上 ，ARChitect 会 显示 该 模块 相关 的 名 称 、 功 能 等 信息 。 


添加 模块 可 以 使 用 拖 搜 方式 : 选中 模块 一 按 住 鼠 标 左 键 一 拖 动 到 中 央 设 计 框 一 释放 鼠标 。 模 块 在 选择 的 时 候 会 被 高 亮 ， 也 可 以 在 选 
择 后 单 击 鼠 标 右键 ， 在 弹出 框 中 选择 Add to component， 如 图 10-5 所 示 。 


Processor element 
<4! Actionpoints (1.0) 
«^ DCCM (1.0) 


sA DSP (1.0) <4 Data Memory In 
£^ Data Cache (1.0) [e DCC 


<4 Data Memory Initiator (1.0) 
<4 Debug Interface (1.0) 

A Floating-point unit (1.0) | nterrunt i 
sA (CCMO (1.0) RCwv2EM 
sA ICCMI (1.0) 

eA Instruction Cache (1.0) 

<4 Instruction Fetch Queue (1.0 


图 10-5 ”添加 模块 


在 拖 忠 模块 时 ，ARChitect 会 上 自动 确定 该 模块 可 以 被 添加 的 位 置 。 如 果 模 块 可 以 被 添加 到 工程 中 ，ARChitect 会 自动 将 模块 放置 于 
正确 的 位 置 。 在 中 央 设 计 框 中 这 些 区 域 会 被 高 膏 显 示 ， 和 而 不 能 添加 的 位 置 则 会 反 同 变 瞳 。 


如 果 选 择 了 一 个 模块 但 是 不 能 被 正确 添加 到 工程 中 ， 可 能 的 原因 有 以 下 几 条 : 

- 设计 中 在 需要 被 添加 的 位 置 被 其 他 模块 占据 。 

设计 中 不 能 存在 多 于 一 个 同类 型 的 模块 。 

+ 需要 其 他 模块 与 该 模块 进行 连接 构成 完整 系统 。 
当 模 块 不 能 航 添 加 时 ，Add to component 弹 出 框 会 变 暗 显示 ， 如 果 使 用 拖 忠 万 式 ， 姐 标 指示 无 法 加 入 。 
如 果 因 为 其 他 模块 占据 了 所 需 模块 的 位 置 ， 那 么 在 删除 该 模块 之 后 再次 添加 即 可 。 

(2) 删除 模块 


从 设计 中 删除 模块 非常 们 单 ， 在 Topology 视 图 中 选中 需要 删除 的 模块 ,右键 单 击 ， 选 择 Delete Component。 在 图 形 化 界面 中 该 
模块 会 被 自动 删除 。 图 10-6 中 显示 正在 将 一 个 浮 点 运算 单元 从 设计 中 删除 。 


Island initiato | > Arbiter 


=] ARCW2EM 

<4 Data Memory Initiator 

«ea DCC 

<4 Debug Interface 

€ Floating-point unit ， 

e^ CCMA | Fold 

€ interrupt Controller Expand 
Rename... 


Lj Delete Floating-point unit 


图 10-6 ”删除 模块 


10.4 PÉRIR 


10.4.1 ”可 选 模块 简介 
ARC EM 1IP 库 提供 了 很 多 与 CPU 架构 相 适 应 的 模块 ， 下 面 列 出 一 些 冲 用 模块 及 它们 的 功能 简略 说 明 。 在 ARChitect GUI 中 ， 左 侧 的 

Processor Element 栏 中 可 以 看 到 这 些 模 块 ， 同 时 由 于 提供 的 IP 库 的 版 本 不 同 ， 这 些 模块 的 配置 会 有 相应 的 改变 。 

- Actionpoints: 增强 软件 实时 调试 功能 的 硬件 扩展 单元 ， 比 软件 断 点 更 可 靠 ， 可 以 用 作 监 视点 和 硬件 断 点 。 

: DCCM/ICCM: 数据 /指令 紧 耦 合 存储 单元 ，DCCM 存 取 一 般 为 单 周期 ，ICCM 则 根据 配置 有 单 周 期 存 取 和 双 周 期 存 取 两 种 。 

- Data Memory Initiator: 当 整 体 结 构 中 没有 数据 Cache 时 ， 使 用 Data Memory Initiatof 来 对 外 部 数据 存储 进行 读 写 操作 。 

: Debug Interface: 如 果 使 用 调试 器 来 对 所 有 的 内 核资 源 进行 访问 ， 结 构 中 需要 有 该 接口 。 

- ICCMO/ICCM1: 两 种 不 同 的 ICCM 结 构 ，ICCM0 具 有 单 周期 读 写 特性 ，ICCM1 具 有 双 周 期 读 写 特性 。 

- Instruction/Data Cache: 指令 和 数据 Cache。 

- Interrupt controller: 中 断 处 理 单元 ， 支 持 最 多 16 个 优先 级 中 断 ， 中 断 数 量 最 多 为 240 个 。 


: Instruction fetch queue: 主动 指令 预 取 指 单元 ， 使 用 短 突 发 式 方式 从 外 部 指令 存储 单元 读 取 指 令 ， 获 取 的 预 取 指 令 存 放 于 内 部 缓存 


- JTAG interface: ARC JTAG 接 口 ， 使 用 ITAG 方 式 访 问 ARC 内 核 时 需要 该 接口 ， 支 持 4 线 站 AG 和 2 线 ITAG 两 种 方式 。 


- Performance monitor: 性 能 寄存 器 单元 ， 包 含有 数 个 统计 性 能 的 寄存 器 ， 有 具体 个 数 可 以 在 设计 中 指定 。 
: Real-time counter: 064 位 计时 计数 器 ， 与 中 断 无 关 。 


- Real-time trace producer: 在 实时 跟踪 (Real Time Trace, RIT) 调试 时 需要 的 一 个 功能 模块 ， 可 以 对 代码 、 数 据 、 核 心 寄 存 器 及 畏 


助 寄存 器 进行 跟踪 调试 。 
-SmaRT: 一 种 可 选 的 片上 调试 硬件 单元 ， 用 于 追踪 指令 执行 过 程 。 
- TimerO/Timerl: 两 个 独立 的 32 位 定时 器 ， 可 用 于 触发 固定 编号 的 时 钟 中 断 。 


: UAUX Interface: 用 户 辅助 寄存 器 接口 ， 当 用 户 自 定 义 模块 有 辅助 寄存 器 时 使 用 该 接口 与 处 理 器 内 核 相 连 ， 第 与 ARC 处 理 器 扩展 
功能 APEX 一 起 使 用 。 


10.5” 软 硬件 一 致 性 


10.5.1 ”什么 是 软 硬 件 一 致 性 


ARChitect 软 件 不 仅 是 生成 处 理 器 RTL 的 工具 ， 而 且 也 是 整个 软件 开 上 友 的 基础 。 通 党 的 软件 开发 过 程 会 使 用 高 级 设计 语言 ， 如 人、 
c++， 经 过 编译 器 编译 成 针对 某 一 特定 类 型 处 理 器 指令 集 (ISA) 的 汇编 代码 ， 然 后 经 汇编 器 处 理 为 目标 文件 ， 最 后 经 由 链接 器 与 相关 
库 文 件 进行 链接 后 生成 最 终 可 执行 文件 。 对 于 ARC 处 理 器 来 说 ， 这 一 整套 工具 被 集成 在 名 为 MetaWare Development 
Toolkit (MWDT) 的 工具 中 ，ARC EM 处 理 器 使 用 名 为 ARCv2 的 指令 集 ， 所 以 编译 出 来 的 可 执行 文件 不 能 在 使 用 其 他 指令 集 的 处 理 器 

(比如 MI1IPS 或 者 PowerPC) 上 运行 。 


编译 器 (Compiler) 生成 的 汇编 指令 在 处 理 器 内 部 执行 时 ， 需 要 分 配 相 关 的 资源 。 而 实现 某 种 特定 功能 的 万 式 .往往 并 不 单一 。 以 
党 用 的 整数 乘法 运算 为 例 ， 可 以 使 用 硬件 乘法 器 进行 计算 ， 也 可 以 使 用 软件 模拟 的 万 式 ， 进 行 移 位 相 加 来 计算 。 如 果 处 理 嚣 中 存在 硬件 
乘法 器 人 资源， 对 应 的 编译 指令 中 可 以 使 用 这 种 资源 ; 而 如 果 在 另 一 种 处 理 器 结构 中 不 仔 企 这 种 硬件 乘法 器 人 资源， 那么 使 用 硬件 乘法 的 指 
令 会 引 友 指令 异 弟 的 错误 ， 从 而 得 不 到 正确 的 结果 。 在 这 种 情况 下 ， 源 代码 的 编译 是 没有 错误 的 ， 生 成 可 执行 文件 的 链接 过 程 也 是 没有 
销 误 的 ， 只 是 在 运行 的 时 候 由 于 处 理 器 无 法 分 配合 适 的 硬件 资源 造成 措 令 异常 ， 所 以 这 种 错误 是 一 种 运行 时 错误 : 无 法 在 编译 或 者 链接 
时 事先 知道 这 种 错误 是 人 否 会 友 生 ， 而 这 仪 仪 取决 于 运行 的 处 理 器 在 物理 上 实际 的 配置 。 这 个 例子 明确 显示 : 要 将 一 个 程序 在 目标 处 理 器 
上 正确 的 运行 ， 保 证 软 硬 件 一 致 性 是 成 功 的 一 个 必要 条 件 。 


ARChitect 会 生成 一 个 愉 tcf 为 后 缀 的 工具 配置 文件 (tool configuration file) ， 该 文件 会 包含 所 涉及 的 处 理 器 中 物理 上 存在 的 硬 
件 资源 信息 。 整 个 工具 链 ， 从 编译 器 到 链接 器 ， 到 仿真 工具 都 可 以 使 用 这 个 工具 配置 文件 进行 同步 。 在 使 用 ARChitect 进 行 工 程 编译 
时 ， 可 以 选择 生成 该 tcf 文 件 ， 其 默认 位 置 为 /project/Build/tool_config/arc.tcf。 在 /tool_config 目 录 下 会 有 其 他 一 些 文 件 ， 它 们 是 这 
个 完整 的 tcf 文 件 的 子 集 。 如 图 10-17 所 示 是 一 个 成 功 的 编译 之 后 生成 的 tcf 文 件 示意 图 。 


| Build Sequence ' 


irem ote/us0] = 


|E] arc_bld.log 
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= core config.h 


ids Iss config.arg 
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图 10-17 生成 的 tcf 文 件 


在 生成 tcf 文 件 的 时 候 ， 请 注意 使 用 这 个 文件 对 应 的 MWDT 版 本 。 在 Topology 视 图 下 ， 选 择 中 央 编 辑 框 中 的 Tool Configuration 框 
， 在 右 侧 的 Options 选 择 对 应 的 工具 版 本 。Tool Configuration 是 默认 存在 的 ， 以 生成 tcf 文 件 进 行 软件 工具 的 同步 ， 如 图 10-18 所 
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View (è) Selected Component 


( ) All Components 


—— 


Tool Configuration — 


Option 
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图 10-18 软件 工具 链 版 本 选择 


10.6 ”小 结 
可 配置 性 对 处 理 器 进行 配置 。 本 章 通 过 与 固定 配置 处 理 器 的 比 对 ， 使 用 一 个 平滑 演进 的 例子 展示 了 可 配置 性 在 实际 使 用 中 的 优势 。 


可 配置 模块 包括 CCM、Cache、 性 能 统计 单元 等 诸多 功能 单元 ， 而 且 用 户 还 可 以 使 用 ARC 的 可 扩展 性 来 进一步 提高 可 配置 性 。 最 后 通 
过 一 个 乘法 器 实例 说 明了 在 使 用 这 种 配置 性 的 时 候 需 要 注意 软 硬 件 一 致 性 的 问题 ， 而 它 也 从 另 一 个 万 面 说 明了 用 面积 换取 速度 的 原理 。 


第 11 草 APEX 扩 展 


假如 已 经 有 了 一 个 处 理 器 ， 需 要 在 该 处 理 器 上 执行 一 个 特定 的 算法 ， 这 时 会 友 生 什 么 事情 ? Fie Ma AASB 
令 ， 而 不 是 一 个 单一 的 指令 。 编 译 后 得 到 的 代码 体积 会 非常 大 ， 执 行 时 间 也 会 非常 长 。 如 果 加 速算 法 执行 ， 减 小 编译 后 代码 的 大 小 ， 会 
很 大 程度 提升 整个 系统 效率 。 对 于 其 他 类 型 处 理 器 ， 这 个 目标 很 难 实现 ， 但 是 在 ARC 系 列 处 理 器 中 ， 提 供 了 一 个 非常 特别 的 功能 来 帮助 
用 户 实现 这 个 目标 。 通 过 使 用 这 个 功能 ， 用 户 可 以 创造 像 那些 ARC 处 理 器 文 持 的 基础 指令 一 样 的 专 有 的 指令 。 这 样 可 以 仅仅 使 用 少数 几 
条 甚至 一 条 指令 来 执行 一 些 特殊 算法 ， 从 而 得 到 一 个 更 加 高 效 的 系统 。 


在 本 章 我 们 将 会 介绍 ARC 处 理 器 中 这 个 非常 特别 的 功能 。 这 个 功能 叫 作 APEX， 正 是 它 让 ARC 系 列 处 理 器 具有 了 可 扩展 性 。 在 本 章 
中 我 们 将 会 先 简要 地 介绍 APEX， 并 在 后 面 的 内 容 中 讲解 创建 一 个 APEX 扩 展 的 整个 过 程 。 首 先 需 要 识别 出 需要 定制 的 指令 或 功能 ， 然 后 
基于 这 些 指令 或 功能 来 创建 APEX 扩 展 。APEX 向 导 可 以 自动 化 处 理 创建 APEX 扩 展 的 过 程 ， 用 户 可 以 在 APEX 向 导 中 添加 指令 、 核 心 寄存 
器 、 辅 助 寄存 器 、 标 志 位 、 条 件 码 、 选 项 和 测试 代码 。 在 创建 好 带 有 测试 代码 的 APEX 扩 展 后 ， 用 户 可 以 通过 ARC 的 用 户 置 信和 度 测试 

(CCT) 来 验证 所 创建 的 APEX 扩 展 。 在 测试 通过 后 ， 用 户 就 可 以 在 程序 中 使 用 APEX 扩 展 了 。 


通过 本 章 学 习 ， 用 户 能 够 独立 去 创建 一 个 简单 的 APEX 扩 展 。 


11.1 APEXZGAR 


APEX 是 ARC Processor Extension 的 缩写 。 


APEX 有 时 叫 作 APEX 扩 展 或 者 APEX 扩 展 组 件 ， 是 一 个 包含 了 单个 或 多 个 由 用 户 自行 定义 的 元 素 的 完整 扩展 。 这 些 扩展 元 素 包括 如 
下 几 种 : 


- P JE REB 
IE RAGS Fo FH Bh AES 
- 扩展 接口 


实际 上 ，APEX 一 般 都 是 一 组 共享 了 用 尸 定 义 硬件 资源 的 指令 ， 这 些 用 尸 定 义 的 资源 可 能 有 功能 逻辑 电路 ， 如 定制 的 加 法 器 、 扩 展 
寄存 器 或 条 件 码 。 


APEX 扩 展 被 存储 在 一 个 用 尸 撒 定 路 径 和 名 称 的 扩展 库 文件 中 ， 并 且 可 以 在 其 他 的 工程 中 被 重复 使 用 。 


可 以 在 ARChitect 中 使 用 APEX 同 导 为 DesignWare ARC 系 列 处 理 器 添加 和 编辑 APEX 扩 展 。APEX 扩 展 可 以 包括 定制 指令 、 扩 展 条 件 
码 、 扩 展 核 心 寄存 器 和 扩展 辅助 寄存 器 等。 图 11-1 用 一 个 例子 展示 了 可 以 在 APEX 同 导 中 定义 的 扩展 内 容 。 


一 APEX Wizard — Stage 2 (Step 2 of 4) 


Extension Contents 


Specify the contents of the APEX extension and configure each item. 


ALU 


Instruction | Sub-Opcode| Operands| Cycles| Exec Mode Flag |Implicit Cor..) Implicit Au... Group Type 
apex core test 0x00 dual n nonblocking | | Read/Write Read/Write 0 
apex aux test Ox01 dual 1 nonblocking | | Read/wWrite Read/Write 0 


Condition Code 


core_REG read write read only 


Auxiliary Register 


Address Instruction Access Extension Access Serializing 
Oxffff_fooo read/write protected write Strict 


Core Register 一 一 
Address Instruction Access Extension Access 


图 11-1 APEXA H 


APEX 向 导 可 以 为 所 有 ARC 处 理 器 系列 创建 扩展 。 每 一 个 处 理 器 系列 都 有 一 套 目 己 的 扩展 界面 (t2AHAPEXA) 和 特定 的 指令 集 、 
流水 线 和 相关 信号 。 


APEX 疝 导 通 过 自动 生成 扩展 的 接口 多 辑 来 使 扩展 的 开 友 流程 自动 化 ， 并 且 可 以 完全 自动 化 地 将 扩展 集成 到 处 理 器 的 流水 线 中 ， 而 
不 需要 扩展 的 开发 人 员 做 任何 相关 的 工作 。 这 种 自动 化 的 实现 可 以 让 扩展 的 开 友 人 员 将 精力 完全 集中 到 扩展 功能 的 开发 上 ， 并 让 他 们 用 
一 种 简单 高 效 的 方式 开发 独立 于 处 理 器 结构 的 APEX 扩 展 。 


11.2 ”为 何 江 加 APEX 扩 展 


在 实际 使 用 中 ，APEX 扩 展 一 般 用 来 加 速 代 码 执行 速度 或 者 减少 代码 体积 。 实 际 上 ， 是 在 用 硬件 逻辑 的 增加 来 换取 软件 实现 的 优 
化 。APEX 使 得 在 现 有 的 处 理 器 框架 中 添加 定制 措 令 而 不 需要 为 指令 的 控制 歇 辑 和 指令 如 何 被 处 理 而 操心 。 可 以 使 用 APEX 向 导 ， 通 过 仅 
仅 几 行 的 Verilog 代 码 来 设计 一 条 单独 的 指令 。 


ARC 人 处 理 器 可 以 支持 如 ADD、SUB、MPY 和 其 他 基础 的 算 林 运算。 然而 ， 如 果 只 是 用 这 些 基 础 算术 指令 来 编译 一 个 特定 的 算法 ， 
这 个 特定 的 算法 可 能 会 包含 很 多 条 基础 指令 ， 这 样 代 码 体 积 会 非常 大 ， 执 行 时 间 也 会 非常 长 。 在 很 多 情况 下 ， 太 大 的 代码 体积 和 太 长 的 
执行 时 间 会 成 为 性 能 洽 贷 ， 所 以 减少 代码 体积 和 执行 时 间 来 提高 系统 效率 束 显 得 非常 重要 。 如 果 可 以 使 用 用 尸 目 行 定义 的 功能 来 扩展 处 
理 器 的 算术 单元 ， 可 以 在 很 大 程度 上 减 小 代码 体积 和 执行 时 间 。 通 过 这 种 方式 ， 可 以 将 处 理 器 的 指令 集 进行 扩展 。 

还 可 以 通过 使 用 APEX 来 引入 第 三 方 的 IP 或 者 用 己 上 自己 以 前 的 设计 。 用 尸 可 以 在 不 需要 创建 忌 线 和 其 他 硬件 结构 的 基础 上 ， 让 指令 
能 够 直接 访问 这 些 模 块 。 例 如 ， 一 个 单独 的 DSP 协 处 理 器 可 以 在 处 理 器 层级 直接 被 集成 到 处 理 器 中 ， 而 没有 息 线 及 相关 的 延 时 和 流水 线 
=] 


E 


¢ 


在 现在 的 必 片 应 用 中 ， 安 全 性 也 成 为 一 个 必 不 可 少 的 条 件 。 使 用 APEX 的 另 一 个 优势 是 ， 用 APEX 实 现 的 私有 功能 更 难 被 破解 ， 这 
样 ， 开 上 友 的 代码 会 更 加 安全 。 


11.3 ”识别 定制 措 令 


本 节 将 介绍 如 何 识别 需要 定制 的 措 令 。 
在 闫 试 了 所 有 可 能 的 对 C 语 言 的 优化 方法 后 ， 可 以 识别 出 那些 消耗 了 大 量 处 理 器 资源 的 热点 。 这 些 热 点 可 以 蔡 换 为 定制 指令 ， 以 取 
得 更 好 的 代码 执行 效率 。 当 这 些 地 方 被 识别 后 ， 下 一 步 也 是 最 重要 的 一 步 ， 就 是 使 用 APEX。APEX 可 以 为 那些 需要 使 用 大 量 基础 指令 的 
功能 创建 硬件 电路 。 通 过 这 种 方式 ， 可 以 获得 系统 性 能 上 的 显著 进步 ， 同 时 也 会 将 实现 的 逻辑 添加 到 处 理 器 中 ， 在 一 定 程度 上 少量 增加 
处 理 器 的 面积 。 
以 下 例子 讲述 了 APEX 在 如 何 优化 一 个 FIR 滤 流 器 的 内 部 循环 中 的 角色 。 语言 的 实现 展示 在 “示例 1: 原始 C 语 言 请 段 ” 中 。 
专门 的 C 代 人 码 用 来 实现 下 面 的 计算 : 
` 将 输入 值 乘 以 一 个 比例 系数 。 
- 对 结果 取 整 。 
. 对 结果 相应 缩减 。 


` 将 结果 加 到 累加 器 上 。 


示例 1: 原始 C 语 言 片段 


LoopCount = 10000 ; 
for( i = 0 ; i < LoopCount ; I++) 
{ 


*dataNew-- = *dataOld ; // Biret Rdataout#AX 
dataOut += (int) ((*coefficient--) * (*dataOld++) ); 


dataOut += 1 << 13 ; 
dataOut >>= 13 ; 
} 


在 编译 后 ， 可 以 得 到 如 图 11-2 所 示 的 指令 。 


fore i D; i < LoopCount ; i+ ) 
Chip. s ^rl,O0x2/0f . Ox2/O0f = find heap item-d-ox33 
bgt s 0x5042 = Maina = apex. clio 
"dataNew4-- = “data0ld ; 
1d s ro, Cars] 
St S Aro, [ri2] 
dataDut += (int) ((*coefficient--) * (*dataüldd--2; 
1d s »ri5», [ars] 
]d s Aro, [r2] 
flip 5 Aro, 4rO,4r15 
add 5s ^»rào,rào,»rl4 
datalüut += 1 << 13 ; 
add s “ro, SPO ,Ox2000 ; Ox2000 = | dump. heap4ox54 
dataÜüut >>= 13 ; 
asr ^rlid,*ro,.13 
add s ^»r3,Xr3,4 
sub “2, HZ, 4 
add s sri? riz, d4 
add s »5r1,5 r1. 1 
b s Ox5018 = main-OxoóO = apex.c!l4?2 


图 11-2 原始 C 代 码 编 译 后 的 指令 


从 5 语言 和 编译 后 的 指令 中 可 以 看 到 ， 这 个 循环 重复 了 10000 次 ， 所 以 完成 该 操作 会 消耗 相当 长 的 时 间 。 可 以 识别 出 计算 dataOut 
的 4 个 运算 步 又 ， 这 些 步骤 可 以 被 一 个 扩展 指令 代 蔡 。 在 实现 这 个 指令 的 过 程 中 ， 一 个 单 周期 的 乘法 器 会 被 用 到 |。 


想得到 的 C 语 言 如 下 示例 2 描述 所 示 。 使 用 了 一 个 名 叫 apex_aux _ test 的 APEX 指 令 来 实现 计算 dataOut 所 需要 的 功能 。 


示例 2: 优化 后 的 C 语 言 


LoopCount = 10000 ; 
for(i = 0 ;i < LoopCount ;i++ ) 
{ 
*dataNew++ = *dataOld ; 
dataOut = apex aux test((*coefficient--), (*dataOldt+)); 
} 


在 明白 了 要 做 什么 之 后 ， 下 一 步 就 是 创建 一 个 名 为 apex_aux_test 的 APEX 指 令 ， 它 将 和 原始 的 C 语 言 代 码 拥有 相同 的 功能 。 在 后 续 
的 章节 ， 我 们 用 这 个 示例 来 展示 如 何 创建 、 验 证 和 使 用 APEX 指 令 。 


11.4 创建 APEX 扩 RE 


该 小 节 展示 了 使 用 APEX 同 导 (APEX Wizard) 来 创建 APEX 扩 展 的 过 程 。APEX 回 导 给 出 了 一 个 局 友 陈 的 界面 来 实现 APEX 扩 展 。 使 
用 一 个 简单 的 例子 来 展示 最 单 使 用 的 一 些 功能 。 


可 以 如 图 11-3 所 示 在 ARChitect 中 单 击 APEX 荣 单 ， 并 选择 New APEX Component 来 打开 APEX 向 导 。 


然后 来 到 APEX 向 导 的 第 一 阶段 。 


File Edit Project 


Components \ Build ' Build Sequence \ 


Gil APEX Examples | 


图 11-3 ”APEX 向 导 


11.5 ”验证 APEX 扩 展 


在 创建 了 APEX 扩 展 后 ， 可 以 进入 下 一 步骤 。 为 了 验证 和 使 用 定制 指令 ， 需 要 添加 定制 的 扩展 到 工程 中 去 ， 如 图 11-13 所 示 。 右 键 单 
击 MyAPEXEtension 的 名 称 来 将 其 添加 到 组 件 CPUisle.ARCv2EM 中 。 这 个 APEX 扩 展 将 显示 在 图 中 的 拓扑 结构 中 的 ARCv2EM 处 。 


File Edit Project APEX View Help 


S Topology | 


system 


ARConnect | | 
ASIC Technology Library 


ARCV2EM CCT 


Modelling 


Gg System element | System element 
GA Automotive EM4, PNT (1.0) 

Ga MyAPEXExtemcion Ls 

E aifftr (1.0) Addto component CPUisle ARCVZEM 

Cà aifirf (1.0) Edit APEX Extension e Debug Interface 


Duplicate APEX Extension sA LC CMD 
af Interrupt Controller 


Delete APEX Extension 


Er idctrn (1.0) 
Cre iirflt (1.0) 
QA mac32rs (1.0) 
Er puwm od (1.0) 

GA puwmod_old (1.0) 
rspeed (1.05 

GA tblook (1.0) 

GA ttpark (1.0) I 
GA ttsprk (1.0) » ae eet Ge ae UOS RN Satis Oe an od 


图 11-13 ”添加 APEX 扩 展 到 工程 中 


在 将 APEX 扩 展 添加 到 工程 中 后 ， 在 扩展 中 添加 了 选项 (Options) “如 图 11-8 和 图 11-10 中 所 示 ) ， 指 定 选 项 的 使 用 值 。 在 所 有 的 
选项 值 都 设置 好 了 之 后 ， 单 击 ARChitect 的 Build 按 钮 来 编译 整个 工程 。 可 以 在 Project_ name/build 中 找到 和 当前 工程 相关 的 Verilog 代 
码 、 测 试 代码 、 脚 本 和 文档 。 


ARChitect 提 供 了 一 个 非常 简单 的 万 式 来 执行 测试 代码 并 获得 相关 结果 。 


可 以 使 用 命令 ARCtest-info 来 得 到 所 有 CCT 测 试用 例 的 列表 。ARCtest 是 ARChitect 中 进行 CCT 测 试用 例 自动 化 测试 的 一 个 内 建功 
能 。APEX 扩 展 的 测试 程序 会 出 现在 测试 列表 的 结尾 处 。 这 个 测试 程序 只 会 在 创建 APEX 扩 展 的 第 五 阶段 中 添加 了 测试 代码 后 才 会 出 现 。 


如 图 11-14 所 示 ， 使 用 命令 ARCtest-test=MyAPEXExtension 来 测试 APEX 扩 展 。ARCtest 会 自动 在 Verilog RTL 人 代码 上 运行 测试 程 


序 。 运 行 的 结果 会 显示 在 命令 提示 符 窗 口 的 最 后 ， 如 图 11-15 所 示 。 图 中 最 后 一 行 显示 运行 的 结果 ，“1 tests,1 passed 0 failed” AMR 
着 测试 程序 最 终 的 运行 结果 符合 预期 。 

115) /remote/usülhome42/sjtu/project/em test/build/tests/core/sleep inti 

117) "remate/usülhome42/sjtu/project/em, test/build/tests/core/sleep timer 

118) /"remote/usülhome42/sjtu/project/em test/build/tests/core/zal 

119) /"remote/usülhome42/sjtu/project/em test/build/tests/core/dhru pur 

120) /"remote/usülhome42/sjtu/project/em test/build/tests/core/dhrustone 


121) /"remote/usülhome42/sjtu/project/em test/build/tests/extensions/MuBPEXExtension 
sjtultusülduemt3580:/remote/usOülhome42/sjtu/project/em test/build > ARCtest -test=MyAPEXExtension 


图 11-14 自动 运行 APEX 测 试 的 命令 


ARCtest + Result obtained from register gp (f1000FF1) 
state . .— PASSED 

code_____ _USEREAT 

number Ü 


system RSSEMBLER 
dept | «CUSTOMER 


ARCtest : 1 tests, 1 passed 0 failed 


图 11-15 测试 结果 


如 果 “1 tests,0 passed 1 failed” 显 示 在 最 后 一 行 ， 则 意味 着 APEX 扩 展 的 Verilog 代 码 或 者 测试 代码 编写 得 有 上 问题。 为 了 解决 这 个 
问题 ， 可 以 在 运行 测试 程序 的 同时 下 载波 形 ， 通 过 波形 上 面相 关 的 信号 来 分 析 问 题 所 在 。 首 先 需要 在 Project_name/build 目 录 下 执行 
make waves 命 令 ， 这 个 命令 将 重新 编译 整个 测试 环境 并 加 入 波形 下 载 的 选项 ， 如 图 11-16 所 示 。 接 着 ,可 以 和 之 前 一 样 ， 执 行 
ARCtest-test=MyAPEXExtension 来 测试 你 的 APEX 扩 展 。 产 生 的 波形 会 被 下 载 到 Project_ name/build 目 录 下 。 


|. ıı 1 a 110,605. Ope 10,519, 000 10,615. 0p0 10,620. 0p0 10, 625. 090 10.63. 000 10,535. npn 10, 


===> 


XXXX E Ca T mE [ IT 7456 
Aull 


3, 000, 000 4, 000, 000 5, 000, 000 é ODD, 000 7,000, 000 8, 000, 000 9, 000, O00 UNUS C NMNNE 


ro. [1,000,000 2,000,000 
mr 


图 11-16 ”用 来 Debug 的 测试 波形 


11.6 ”使 用 APEX 扩 展 


在 11.3 节 ， 介 绍 了 如 何 识别 需要 定制 的 指令 ， 在 11.4 节 和 11.5 节 ， 创 建 了 一 个 APEX 扩 展 并 验证 了 它 的 功能 。APEX 扩 展 中 的 指令 
apex aux test 会 被 用 来 展示 使 用 定制 指令 的 优势 。 


在 11.3 节 ， 原 始 的 C 语 言 代 码 已 经 存在 。 


LoopCount = INIT LOOP COUNT; 
tor( i = 0 7 i < LoopCount s i++ ) 
{ 
*dataNew++ = *dataOld ; 
dataOut += (int) ((*coefficient--) * (*dataOld++)); 
dataOut += 1 << 13; 
dataOut >>= 13 ; 


使 用 APEX 扩 Fe Pe MA ERIE SARA. 


定制 指令 apex_aux_test 将 功能 


dataOut += (int) ((*coefficient--) * (*dataOld++)); 
dataOut += 1 << 13; 
dataOut >>= 13 ; 


放 到 了 单个 指令 中 。 因 此 在 创建 了 定制 指令 之 后 ， 可 以 如 下 所 示 实 现 相应 的 功能 。 


dataOut = apex aux Ltest((^coefficient--), (*dataOldrr)); 


XABEAS MIER TS] ERAT ELE. 


在 编译 工程 的 时 候 ，ARChitect 生 成 工具 创建 了 编译 程序 需要 的 文件 。 文 件 apexextensions.h 在 这 个 过 程 中 被 生成 到 了 
Project name/build/tests/common 的 目录 下 。 需 要 包含 apexextensions.h 到 C 程 序 的 头 文件 中 ， 如 图 11-17 所 示 。 


#include <stdio.h> 
#include <stdlib.h> 


#include "apexextensions.h" 


图 11-17 C 代 码头 文件 


图 11-18 是 apexextensions.h 的 截图 ， 它 定义 了 编译 器 中 可 以 看 到 的 APEX 扩 展 组 件 ， 可 以 看 到 ，APEX 中 的 两 个 定制 指令 
apex_core_test 和 apex_aux_test， 以 及 扩展 核心 寄存 器 core_REG 和 扩展 辅助 寄存 器 aux_REG。 


Jt **** DO NOT EDIT this file is generated by ARChitect? **** 
He 
* Description: Header file declaring the compiler extensions for apex components 
fc J 
F. 


ifndef  apexextensions H 
define apexextensions H 


// User extensiun instruction - apex core test 
extern long apex core testílong, longl: 
#pragma intrinsic(apex core test, opcode => 0x87, sub opcode => 8x88 ) 


/f User extension instruction - apex aux test 
extern long apex aux test(long, Long): 
#pragma intrinsic(apex aux test, opcode => 0x07, sub opcode => 0x0l | 


// User extension aux register - aux REG 
Zdefine AR AUX REG oxfffffooe 


// User extension core register - core REG 

#define CR CORE REG 32 

#pragma Core register(32, name-»"core REG") 

#pragma Core register(32, non interlack cycles=>"2") 


#endit 


图 11-18 apexextensions.h 文 件 内 容 


包含 apexextensions.h 的 目录 同时 应 该 被 添加 到 程序 的 设置 中 去 。 如 图 11-19 所 示 ， 这 个 路 径 补 用 来 查找 apexextensions.h。 在 
MetaWare 的 程序 属性 设置 中 可 以 找到 该 界面 。 


Properties for apex 
type filter text Settings 


b Resource 


Configuration: | Debug [ Active ] = | Manage Configurations... 


Builders 
= €/C4++ Build 
Build variables TCF Association | & Tool Settings | "Build Steps | "Build Artifact | «Binary Parsers | © Error Parsers 
Environment 
Logging 


3 General | fremotefusO1home42/sjtu/project(em test/build/tests/common 


Too! Chain Editor US Oplirmzaliory Debugging 
(8 Storage Mapping 


v lli MetaWare ARC EM C/C---- Compiler Include Directories (one per line) 


bb CIC++ General 
aL, 
Project References (B Preprocessor 


Refactoring History a Include Directories 


ia 
Run/Debug Settings ME 
È Processor/Extensions 
E DSP Extensions 
g& Memory Model 
(3B Overlay Suppart 
(5 Special Register Widths 
< ip ARCompact Assembler 
E assembler preprocessor 
£g General 
( Include paths 
È ARCompact Specific 
d DSP Support 
v ih MetaWare Linker far ARCompact 
( Runtime Libraries 
(8 Search Path 
(2 Additional Object Files & Libraries 
B Command files 
(5 Map Listing 
ig Output Generation 
(3 Miscellaneous 
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图 11-19 ”apexextensions.h 文 件 的 包含 路 径 设 置 
在 所 有 的 设置 完成 之 后 ， 可 以 进入 编译 程序 的 步骤 . 


修改 后 的 C 程 序 在 编译 、 汇 编 和 链接 后 可 以 创建 出 一 个 可 执行 的 镜像 。 人 在 XCAM 念 真 工具 中 、HDL 硬 件 仿真 或 硬件 电路 平台 上 运行 
这 个 镜像 可 以 得 到 C 程 序 的 周期 精确 的 行为 换 述 。 由 MetaWare 开 友 工 具 套 件 提供 的 nSIM 指 令 集 仿真 工具 可 以 得 到 指令 执行 数目 的 统计 
结果 ，nSIM Pro 可 以 得 到 执行 周期 的 估计 值 。 


在 应 用 中 使 用 APEX 扩 展 之 前 ， 可 以 在 xCAM 中 进行 原始 C 程 序 的 仿真 得 到 一 个 执行 程序 需要 的 时 钟 周 期 的 描述 。 第 一 列 是 执行 的 指 
令 次 数 ， 第 二 列 是 相应 指令 在 流水 线 中 延迟 的 总 周期 数 ， 第 三 列 是 相应 指令 执行 消耗 的 总 的 时 钟 周 期 数 。 可 以 看 到 这 个 内 部 循环 每 次 需 
要 18 个 时 钟 周期 来 执行 ， 其 中 8 个 是 流水 线 的 延 时 ， 如 图 11-20 所 示 。 


[1:1 ER EGCTAS a 


- 42 for¢ 1 2 0 ; 1i < LoopCount ; iH ) 
10009 liainoxeo cmp, s Arl,0x270f ; Ox270fT = find heap item4x33 
10003 Nai n+O x66 bgt_s Ox5042 = main4OxSa = apex.cl50 
- AA *dataNew++ = *dataüld : 
20000 lna1n-a x68 ]d. s Xro, [xr3] 
20000 mai nHoxwba st s Aro, [4r12] 
- 45 dataQut += (int) (i(*"coefficient--) * (*datalld++)); 
10008 mai n+Ox6C 1d 5s Ari5, [ars] 
200) 2 ial n+Oxbe ld_s Aro, [ar | 
49944 Nai n-+HOx FO npy_s Aro, %r0,4%r15 
20006 mai nHox y z add_s “rd, sro, rid 
- 46 dataüut += 1 << 13 ; 
10004 maints fA add_s Aro 3rO,0%2000 5 Ox2000 = _dump_heap+ox54 
一 47 dataÜüut >>= 13 ; 
10000 fiainHoxva asr 4f14,%r0,13 


图 11-20 ”使 用 APEX 扩 展 之 前 的 性 能 仿真 描述 


接 下 来 可 以 添加 APEX 扩 展 并 编译 。 可 以 看 到 图 11-20 中 用 来 计算 dataOut 的 所 有 指令 被 定制 指令 apex_aux_ test 取代 了 。 因 此 
dataOut 的 计算 此 时 只 需要 一 个 时 钟 周期 ， 而 不 是 之 前 的 多 个 时 钟 周期 来 完成 。 


在 使 用 了 APEX 扩 展 乙 后， 可 以 得 到 如 图 11-21 所 示 的 描述 ， 这 个 内 部 循环 现在 只 需要 10 个 时 钟 周 期 来 完成 ， 这 意味 痢 相 比 原始 C 程 
序 ， 可 以 在 每 次 循环 中 节省 了 8 个 时 钟 周期 。 如 果 循 环 要 执行 10000 次 ， 这 意味 着 可 以 节省 80000 个 时 钟 周期 ， 对 于 一 个 循环 来 讲 ， 这 节 
省 了 大 量 的 执行 时 间 。 如 果 这 个 循环 会 被 执行 更 多 次 ， 可 以 节省 下 来 更 多 的 时 间 |。 


- for(i = 0 51 < LoopCount i++ ) 
10001 10005 [ia naoxdo CME %rl2 ,DOx270T _Tind_heap_iten+oxss 
10001 |. 10005 na1n-aoxde bgt s Ox5OaB - mainiOxfo = haa .C173 
- - 69 *dataNewHt+ = “data0ld ; 


10000 300€ 20000 niai na-Ox de ld s ro, ri] 
10000 100 20000 main+Oxda ep» «ro, [%r2] 
- = TO dataÜut = apex aux test((*coefficient--), (*data0ld++)); 
10000 i 10008 hal Hx 1d. s Arig, Darl | 
10000 . 10002 20002 ai n+Oxde ld s ^ro, r3] 
10000 0 10000 ai n+oxeo apex_aux_test %r14,%r0,%rl4 


图 11-21 使 用 APEX 扩 展 之 后 的 性 能 仿真 描述 


到 此 为 止 ， 完成 了 添加 APEX 扩 展 到 我 们 的 应 用 程序 的 所 有 步骤 的 介绍 。 


11.7 小结 


在 本 草 中 介绍 了 ARC 处 理 器 中 一 个 非常 特别 的 功能 : APEX 扩 展 。APEX; 湛 加 定制 指令 到 已 经 存在 的 ARC EM 处 理 器 框架 中 ， 而 不 需 
要 担心 如 何 编写 控制 逻辑 或 者 处 理 器 将 会 如 何 处 理 这 个 指令 。 可 以 在 APEX 回 导 中 仅仅 使 用 几 行 Verilog 代 码 来 设计 一 个 独立 的 功能 


辑 。 


在 介绍 了 APEX 及 其 优点 后 ， 进 一 步 展 示 如 何 使 用 这 个 功能 ， 提 供 了 一 个 示例 来 展示 使 用 APEX 的 整个 过 程 ， 这 个 过 程 包括 如 何 识 
别 、 创 建 、 验 证 和 使 用 APEX 扩 展 。 在 阅读 完 本 章 后 ， 读 者 能 够 依照 本 章 中 的 步骤 来 创建 一 个 完整 的 个 性 化 APEX 扩 展 。 


WRA 音 用 辅助 寄 仔 器 快速 参考 


1.LP_START 
地 址 : 0x02 
访问 权限 : rw 


The loop start (LP. START) register contains the address at which the current zero delay loop begins.The loop start register can be set up with 


the LPcc instruction or can be manipulated using the auxiliary register access instructions (see LR and SR) . 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 1211109 876 54 321 0 


LP. START[31:1] 


图 A-1 LP_START Register (PC_SIZE==32) 


31 30 29 28 27 26 25 24 23 22 21 2019 18 17 1615 1413 12 1110 98765 43210 


图 A-2 LP START Register (PC_SIZE<32) 
2.LP. END 
地 址 : 0x03 
访问 权限 : tw 


The loop end (LP_END) register contains the address of the first instruction after the cutrent zero delay loop.The loop end register can be set 


up with the LPcc instruction or can be manipulated using the auxiliary register access instructions (LR and SR) . 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 109 8765 43210 
LP END[31:1] 0 


图 A-3 LP END Register 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 1312 11 109 8706 54 32 10 


图 A-4 LP END Register (PC_SIZE<32) 
3.IDENTITY 
地 址 : 0x04 


访问 权限 : r 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 1109876543210 


CHIPID[15:0] ARCNUM[7:0] ARCVER[7:0| 


图 A-5 IDENTITY Register (PC SIZE 32) 


#A-1 IDENTITY Registers Æ A 


位 H fü o x 


ARC baseline instruction set version number 

0x00 to OxOF = ARCtangent-A4 processor family (Original 32-Bit only processor cores) 
0x10 to Ox1F = Reserved for ARCtangent-A5 processor family 

0x20 = Reserved for ARC 600 processor family 

0x21 =ARC 600 processor family, basecase version | 

0x22 = ARC 600 processor family, basecase version 2, supports additional BCR region and 
accesses to non-existent BCRs return 0. 

0x23 = ARC 600 processor family, basecase version 3, supports SLEEP n instruction syntax. 
0x24 = ARC 600 processor family, basecase version 4 

0x25 = ARC 601 processor, supports ARC600 BUILD CONFIG BCR in the ARC601 
processor. 

0x26 to Ox2F- Reserved for ARC 600 processor family 

0x30 = Reserved for ARC 700 processor family 

0x31 = ARC 700 processor family, basecase version 1 


ARCVERJ7:0] 


0x32 = ARC 700 processor family, basecase version 2, supports additional BCR region and 
accesses to BCR region have updated exception model. 

0x40 to Ox4F = ARC EM processor 

0x50 to OxSF = ARC HS processor 

0x60 to OxFF = Reserved 


YYY VVVV NNN o N N NN WV 


This field allows you to uniquely identify each core in a multi-core system. Values: 0 to 255 
Default: 1 

The value of this field is a reflection of the -arc num option in the ARChitect tool. In a multi- 
core configuration, ARChitect assigns the value of the -arc num option to the first core. All 
the other cores are assigned increasing sequential values based on their order in the chain. For 
example, if the -arc num option is specified as 3, the first core in the chain is assigned 3 and the 

ARCNUM[7:0] ! 
other cores in the configuration are assigned core IDs 4, 5, 6, and so on. 

The input pin arcnum[7:0] is provided on the core interface to define the ARCNUM field. 
Additionally, boot software can use the this field to identify each processor core in a multi-core 
configuration and execute core-specific tasks. For example, software can load unique application 
code based on the core ID in a data-flow system, in which each core performs only a part of the 
algorithm. 


CHIPID[15:0] The unique chip identifier assigned by Synopsys. 


4.DEBUG 
地 址 : 0x05 
访问 权限 : RG 


30 29 28 27 26 25 24 23 22 20 19 18 14 13 12 11 10 9 8 7 65 4 3 


insa pafen] e ea a E s a 


图 A-6 DEBUG Register 


#A-2 DEBUG Register3 X 3L 


位 wy fü X 
Single Step (SS) This bit is ignored by the ARCv2-based processor. 
FH is the approved method of stopping the ARCv2-based processor externally by the 
host. This bit does not have any affect if the ARCv2-based processor is already halted 


and the host sets this bit. The FH bit is not a mirror of the STATUS register H bit, that is, 
clearing FH does not start the processor. The FH bit always returns 0 when it is read. 


Force halt (FH) 


Single instruction stepping is provided through the use of the IS bit, the SS bit is ignored. 
Single instruction step (IS) | . 
If the host sets the IS bit, the ARCv2 core executes one instruction. 

RA bit is used by the debug host to determine that a target reset has occurred. The RA bit 


Reset applied (RA) 
ae is set to 1 on a hard reset of the CPU and can be written only by the host. 


ZZ bit indicates that the ARCv2-based processor is in the “ sleep” state. Use the SLEEP 

S] tate (ZZ) instruction to force the ARCv2-based processor enter the sleep state. This bit is cleared 
eep state 

j whenever the ARCv2-based processor wakes from sleep state. This bit is a status bit, and the 


host cannot write to this bit. 


SM field indicates the sleep mode of the processor. This field controls whether clocks for 
Sleep Mode (SM) the internal timers and real-time clock are turned off during sleep state. This bit is a status 
bit, and the host cannot write to this bit. 


UB bit indicates that BRK is enabled in user mode. This bit is provided to allow an 
User-mode breakpoint (UB) external debugger to debug user-mode tasks. This bit is always set to 0 to ensure that a user- 
mode task cannot stop the processor by executing a BRK instruction. 


BH bit is set when execution of a breakpoint instruction is attempted. This bit is cleared 
Breakpoint halt (BH) when the H bit in the STATUS32 register is cleared, that is, when single-stepping or 
restarting the ARCv2-based processor from the halted state. 


SH indicates that the ARCv2-based processor has halted itself with the FLAG instruction. 

Self halt (SH) This bit is cleared whenever the H bit in the STATUS register is cleared, that is, the ARCv2- 
based processor is running or a single step has been executed. 

The hostor the ARCv2-based processor can read the LD bit at any time and indicate that 

there is an outstanding load waiting to complete. The host must wait for this bit to clear 


Load pending bit (LD) , «oer l 
before changing the state of the ARCv2-based processor. This bit is a status bit, and the host 


cannot write to this bit. 
5.DEBUGI 
地 址 : Ox1F 


访问 权限 : RG 


31 30 29 28 27 26 25 24 23 22 21 2019 1817 16 15 14 13 12 11109876543210 


图 A-7 DEBUGI Register 


#A-3 DEBUGI Register3 X 3L 


位 dm 描 x 
When set to 1, the exception or interrupt vector break functionality 1s enabled. In this mode, 
on an interrupt or an exception, the processor executes a breakpoint at the location of the 
corresponding vector in the exception table if the LSB bit of the vector value is set to 1. As 
instruction addresses are always 16 bit aligned, this bit is unused for addressing purposes and 
functions only to enable a breakpoint at this vector. The breakpoint takes affect in place of the 
final jump of the sequence. So, the entire sequence is replayed before the breakpoint is executed. 


Register Bank (present with RGF NUM BANKS > 1) 

Pre-empts STATUS32.RB for all instructions originating from the debug interface when 
DEBUGI.RBE is set. When DEBUGI.RBE is not set, the existing value STATUS32.RB is used 
where RBE - bit 19. 

If RGF NUM BANKS {== 0, < 2, < 4}, then the (RB, RB[2:1], RB[2]} field is RAZ/IOW. 
read as zero and ignored on write. 


Register Bank Enable. When this bit is set, DEBUGI.RB value preempts STATUS32.RB for 
RBE all instructions originating from the debug interface. When DEBUGI.RBE is not set, the existing 
value STATUS32. RB is used. 


6.Program Counter, PC 
地 址 : 0x06 
访问 权限 : rG 


31 30 29 25 27 26 2 24 25 22 21 20 ib 17 16.153 14413 1211 109 57656545210 


NEXT PC[31:1] 


图 A-8 PC Register Addressing Full 32-bit Addressing Space 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 #1615 14131211 109876543210 


图 A-9 PC Register Addressing a Reduced Addressing Space (PC SIZE--32) 


7.Status Register, STATUS32 


地 址 : OxOA 


访问 权限 : rG 


The status tegister,S TATUS32 that performs the following functions: 


: Enables or disables certain actions within the processor 


: Contains a number of flags to indicate the status resulting from the following: 


- The evaluation of instructions 


: The taking of interrupts 


: [he raising of exceptions. 


30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 111098 7654321 0 


WD emn Sea Se 


图 A-10 STATUS32 Register 


表 A-4 STATUS32 Registet 域 定义 


位 域 fü xh 
H Halt flag 
E[3:0] Interrupt priority operating level of the processor 
AE Processor is in an exception state 
DE Delayed branch is pending 
U User mode 
V Overflow status flag 
E Carry status flag 
N Negative status flag 
Zz Zero status flag 
Ly Zero-overhead loop enable 
DZ EV DivZero exception enable 
SC Enable stack checking 
ES EI S table instruction pending 
RB[2:0] Select a register bank 
IE Interrupt Enable; enables interrupts at or above the priority level set in STATUS32.E 


8.Branch Target Address, BTA 


地 址 : 0x412 


访问 权限 : RW 


The BTA register is updated in the following situations: 


: A branch or jump with a delay slot is taken 


: Returns from exceptions that occur between a branch or jump and any associated delay slot instruction 


- When an EI_S (Execute Indexed) instruction is executed 


: When written by an SR instruction 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 131211 10 9 8765432 10 


BTA[31:3] 


图 A-11 BTA Register (PC_SIZE==32) 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 1312 1110 9876543210 


me s 


图 A-12 BTA Register (PC SIZE < 32) 
9.Status Register Priority O,STATUS32 PO 
地 址 : OxOB 
访问 权限 : RW 


When fast interrupts are enabled in the processor,on the highest priority interrupt (PO) entry,the processor stores the value of the STATUS32 


register to the STATUS32 PO register. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 87 6543210 


aol ao [o 


图 A-13 STATUS22, PO Register 
10.Interrupt Vector Base Register, INT_VECTOR_BASE 
地 址 : 0x25 
访问 权限 : RW 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 1514 13 12 11109876543210 


图 A-14 INT VECTOR BASE Register (PC_SIZE==32) 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 1514131211 10987 65 43210 


图 A-15 INT. VECTOR BASE Register (PC SIZE <32) 


11.Interrupt Context Saving Control Register, AUX_IRQ CTRL 
地 址 : OxOE 
访问 权限 : RW 


The AUX IRQ CTRL register controls the behavior of automated register save and restore or prologue and epilogue sequences during interrupt 


entry and exit,and context save and restore instructions. 


31.30 29 25 27 26 25.24 23 22 2L 20 IY 17 16 15 14 13 12 11 10 9 876543210 


图 A-16 AUX IRQ CTRL Register 


#A-5 AUX IRQ CTRL Register Æ 3t 


位 x fai x 


Indicates number of general-purpose register pairs saved, from 0 to 8/16. This register 
saturates at 16 when the RGF NUM REGS == 32,and 8 when the RGF NUM REGS == 16. 
The set of registers saved include the lowest numbered registers which are implemented in the 
register file. For 16 entry register files, the registers implemented and saved are not contiguous. 


B Indicates whether to save and restore BLINK (ignored if NR is greater than or equal to 16) 
L Indicates whether to save and restore loop registers (LP COUNT, LP START, LP END) 
U Indicates if user context is saved to user stack 

R Reserved 


LP Indicates whether to save and restore code-density registers (EI BASE, JLI BASE, LDI BASE) 
12.Active Interrupts Register, AUX_IRQ ACT 
地 址 : 0x43 
访问 权限 : RW 


This register records the current stack of nested interrupt handlers.When you set the least significant bit tol in the Active field,it indicates that the 


highest priority interrupt is active interrupt. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 1615 14 13 12 11 109876543210 


图 A-17 AUX IRQ ACT Register 


表 A-6 AUX_IRQ_ACT Registet 域 定义 


位 d 描 述 


Bit 1 indicates whether there is an active interrupt at priority 1. If fewer than 16 


Active[ 15:0] in ! 
priority levels are configured, unused bits are read as zero and ignored on write. 


Snapshot of the STATUS32.U bit when an interrupt is taken at a point where 


B Active[15:0] == 0. 


13.Interrupt Select, IRQ SELECT 
A5 hb: Ox40B 
访问 权限 : RW 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109 876543210 


图 A-18 IRQ SELECT Register 


#A-7 IRQ SELECT Register3 X X 


位 域 Ho xh 
Selects a specific interrupt. If Interrupt [m-1:0] is greater than M+16-1 or 


Interrupt| m-1 :0] less than 16, then all banked IRQ auxiliary registers are read as zero and 1gnored 
on write. 


14.Interrupt Priority Register, IRQ PRIORITY 
地 址 : 0x206 


访问 权限 : RW 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 109 876543 2 1 0 


图 A-19 IRQ PRIORITY Register 


#A-8 IRQ PRIORITY Registet 域 定义 


位 HM 描 xh 
P Value of IRQ PRIORITY, for the selected interrupt 


15.Interrupt Enable Register, RQ ENABLE 
地 址 : Ox40C 
访问 权限 : RW 


31 30 29 28 27 26 25 24 23 22 21 2019 18 17 16 15 14 13 12111098765 43210 


图 A-20 IRQ ENABLE Register 


#A-9 IRQ ENABLE Registet 域 定义 


位 x He 述 


Value of IRQ ENABLE for the selected interrupt. If an interrupt enable of 0 1s 
E assigned, then the associated interrupt is disabled. If an interrupt enable of 1 is assigned, 
then the associated interrupt 1s enabled 


16. Interrupt Trigger Register, RQ TRIGGER 
地 址 : Ox40D 
访问 权限 : RW 


31 3029 01 


图 A-21 IRQ TRIGGER Register 


表 A-10 IRQ TRIGGER Registet 域 定义 


位 域 He OUR 
Value of IRQ TRIGGER, for the selected interrupt. If an interrupt trigger value of 0 is assigned, then the 


T associated interrupt 1s level sensitive. If an interrupt trigger of 1 1s assigned, the associated interrupt 1s pending up to 
one cycle after a transition from 0 to 1 1s detected on the interrupt line that 1s sampled at CPU clock frequency. 


17.Interrupt Pending Register, IRQ PENDING 
地 址 : 0x416 


访问 权限 : R 


31 30 29 28 27 26 25 24 23 22 21 20 29 18 17 16 15 14 13 121110 98 76543 21 0 


nT 


图 A-22 IRQ PENDING Register 


#A-11 IRQ PENDING Registet 域 定义 


位 d 描 xh 
IP Value of IRQ PENDING, for the selected interrupt. Value 1 indicates there is a pending interrupt. 


18.Interrupt Pulse Cancel Register, [RQ PULSE CANCEL 
地 址 : 0x415 
访问 权限 : W 


31 30 29 28 27 26 25 24 23 22 21 20 1918 17 16 15 14 13 121110 9 8 76543210 


图 A-23 IRQ PULSE CANCEL Register 


£ 
b s 


#A-12 IRQ PULSE CANCEL Registet 域 定义 


位 x 描 述 


Value to be written to IRQ PULSE CANCEL for the selected interrupt.. A write of pulse- 
(o cancelling value 0 1s alwaysignored. A write of pulse-cancelling value 1 to an non-level sensitive 
interrupt clears any saved interrupt 


19.Interrupt Status Register,IRQ. STATUS 

地 址 : Ox40F 

访问 权限 : R 

31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 111098 765 432 1 


图 A-24 IRQ STATUS Register 


表 A-13 IRQ STATUS Registet 域 定义 


fü $ 
P[3:0] Value of Interrupt Priority Register, IRQ PRIORITY, for the selected interrupt 
E Value of Interrupt Enable Register, IRQ ENABLE, for the selected interrupt 
T Value of Interrupt Trigger Register, IRQ TRIGGER, for the selected interrupt 
Ip Value of Interrupt Pending Register, IRQ PENDING, for the selected interrupt. Bit 31 


allows quick check for pending interrupt using the .MI condition or less-than-zero test. 


20.Interrupt Priority Pending Register,/RQ PRIORITY. PENDING 


地 址 : 0x200 


访问 权限 : R 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 1212 11109 876 54 32 10 


图 A-25 IRQ PRIORITY PENDING Register 


#A-14 IRQ PRIORITY PENDING Registet 域 定义 


位 Hm Ho R 
p Bit 1 indicates whether there 1s a pending interrupt at priority level 1. If fewer than 16 priority 


levels are configured, then unused bits inPending [n-1:0] are read as zero. 
21.Software Interrupt Trigger, AUX. IRQ. HINT 
地 址 : 0x201 


访问 权限 : RW 


Writing the chosen interrupt value to the AUX_IRQ_HINT register generates a software triggered interrupt. Writing a value of any unimplemented 


interrupt,such as 0,clears any software triggered interrupt. 


A read from the AUX. IRQ HINT register returns the value of the current software triggered interrupt. A new interrupt must not be generated 


using the software triggered interrupt system until any outstanding interrupts have been serviced. The AUX IROQ HINT register must be read and 
checked as 0x0 before a new value is written. 


Use the AUX. IRQ HINT register to set the associated interrupt before generating a pulse sensitive interrupts. 


31 30 29 28 27 26 25» 24 23 22 21 20 19.15 1/16 15 1413 122 11109 87654 32 1 0 


图 A-20 AUX IRQ HINT Register 


22.Interrupt Cause Registers, [CAUSE 


地 址 : Ox40A 


访问 权限 : R 


A read from the AUX_IRQ_HINT register returns the value of the current software triggered interrupt. A new interrupt must not be generated 


using the software triggered interrupt system until any outstanding interrupts have been serviced. The AUX IROQ HINT register must be read and 


checked as 0x0 before a new value is written. 


Use the AUX_IRQ_HINT register to set the associated interrupt before generating a pulse sensitive interrupts. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 141312 11109 876 54 32 100 


图 A-27 ICAUSE Register 
23.Exception Return Address, ERET 
地 址 : 0x400 
访问 权限 : RW 


When returning from an exception,the program counter (see Program Counter,PC) is loaded from the Exception Return 


Address (ERET) register. 


31 30 29 28 27 26 25 24 23 22 21 20 19 15 17 16 15 4.131211 109 8765 43 7 10 


ERET[31:1] 


图 A-28 ERET Register (PC SIZE--32) 


31 30 29 28 27 26 25 24 232221 20 19 18 1716 15 4 1512 111098 76 5 4 32 10 


图 A-29 ERET Register (PC SIZE < 32) 
24.Exception Return Branch Target Address, ERBTA 
地 址 : 0x401 
访问 权限 : RW 


When returning from an exception,the Branch Target Address register (see Branch Target Address,BTA) is loaded from the Exception Return 


Branch Target Address (ERBTA) register. 


31 30 29 28 27 26 25 24 23 22 2120 19 18 17 16 15 14 13121110 9 87 6543271 Q0 


NEXT PC[31:1] 


图 A-30 ERBTA Register (PC SIZE--32) 


I 30:24 25 27 7D 25 2E ZI ZL ZEE T9 IM yV 16 D I4 ESUJZ ee 57060252 X2 IJ 


图 A-31 ERBTA Register (PC SIZE <32) 
25.Exception Return Status, ERSTATUS 


地 址 : 0x402 


访问 权限 : RW 


An exception saves the current status register STATUS32 register (see Status Register, STATUS32) in auxiliary register ERSTATUS. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 1211109 8 7 6 5 4321 0 


图 A-32 ERSTATUS Register 


26.Saved User Stack Pointer, AUX_USER_SP 

地 址 : 0x0D 

访问 权限 : RW 

‘This register is used to save the kernel stack pointer while in user mode. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 1211 109 8 7 654 32 1 0 


AUX USER SP [31:0] 


图 A-33 AUX USER SP Register 


27.Exception Cause Register, ECR 


地 址 : 0x403 
访问 权限 : RW 
The Exception Cause register (ECR) allows an exception handler access to information about the source of the exception condition. 


The Vector Number is an eight-bit number,directly corresponding to the vector number and vector name being used.See Table 3-10 on page 56 


for alist of vector numbers. 


Because multiple exceptions share each vector,the eight bit Cause Code is used to identify the exact cause of an exception.See Table 3-10 on page 


56 for a full list of exception cause codes. 


The eight bit parameter is used to pass additional information about an exception that cannot be contained in the previous fields.See Table 3-10 on 


page 56 for a full list of exception parameters. 


ECR[29:24]bits are reserved.Reading any reserved bits returns 0 and writes to such bits have no effect. 


P bit indicates that an exception occurred in an interrupt prologue. 


U bit indicates that,although the processor was in user mode when an exception occurred,kernel privileges were in force at the time. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 131211109 876 54321 0 


图 A-34 ECR Register 


28.Exception Fault Address, EFA 


地 址 : 0x404 


访问 权限 : R 
When a memory access triggers an exception,the exception fault address register (EFA) is loaded with the address that triggered the exception. 


31 30 29 28 27 26 25 24 23 222120 19 18 17 16 15 14 13 1211109 87654321 0 
图 A-35 EFA Register 

29.Invalidate Instruction Cache,IC_IVIC 

地 址 : Ox10 

访问 权限 : W 

A write to the IC. IVIC register invalidates and unlocks the entire instruction cache. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12.11 109 876 54 321 0 


IC IVIC 


图 A-36 IC IVIC Register 
30.Instruction Cache Control Register,IC. CTRL 
地 址 : Ox11 
访问 权限 : RW 


3l 30:29 28 27 25 75.274 73 22 21 20. 19 18 16 13 M 1312201 1095 16 5 4 3 21 


EE cH 


图 A-37 IC CTRL Register 


表 A-15 IC CTRLRegister3X Æ X 


Disable Cache: Enables/Disables the cache 


DC[0] 0 — Enable Cache 
l - Disable Cache R/W 


Reserved [2:1] Read as zero and ignored on write = 


Success Bit: Success of last cache operation 
SB[3] 0 — Last cache operation failed R/W 
l — Last cache operation succeeded 


Reserved [4] Read as zero and ignored on write = 


Address Debug Type: Used for debug purposes for when accessing 
cache RAMs. 


AT[5] R/W 


0 — Direct Cache RAM Access 


— Cache Controlled RAM Access 


l 
Reserved[31:6] Read as zero and ignored on write = 


31.Invalidate Data Cache, DC_IVDC 


地 址 : Ox47 
访问 权限 : W 
Writing a 1 to the IV flag (bit 0) in the DC IVDC register invalidates and unlocks the entire data cache. 


31 30 29 28 27 26.25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 109 58 7:06 5 4 32 1 


es dN 


图 A-38 DC IVDC Register 


#A-16 DC_IVDC Register3 X A 


位 m fü X 访问 类 型 


Invalidate Data Cache: Invalidates entire data cache 


IV[0] 0 — No Action W 
1 - Invalidate Data Cache 


32.Data Cache Control Register, DC CTRL 
地 址 : 0x48 
访问 权限 : RW 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 4 3 2 


ooo o i 


图 A-39 DC CTRL Register 


#A-17 DC_CTRL Registet 域 定义 


位 域 MEET: 访问 类 型 


Disable Cache: Enables/Disables the cache 
DC[0] 0 — Enable Cache R/W 
| — Disable Cache 


Success Bit: Success of last cache operation 
SB[2] 0 — Last cache operation failed R/W 
| — Last cache operation succeeded 


Address Debug Type: Used for debug purposes for when accessing 
cache RAMs. 

0 — Direct Cache RAM Access 

1 — Cache Controlled RAM Access 


AT[5] R/W 


Invalidate Mode: Selects the invalidate type 
IM[6] 0 — Invalidate data cache only R/W 
| — Invalidate data cache and flush dirty entries 


Lock Mode: Selects the effect of a flush command on a locked entry 
LM[7] 0 — Disable flush on locked entry R/W 
| — Enable flush on locked entry 


Flush Status: Status of the data-cache flush mechanism 
FS[8] 0 — Idle R 
1 — Flush operation in progress 


33.Flush Data Cache, DC_FLSH 

地 址 : Ox4B 

访问 权限 : W 

31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12111098 7654321 D 


图 A-40 DC FLSH Register 


#A-18 DC_FLSH Registet 域 定义 


位 dm fü X 访问 类 型 


Flush Data Cache:- Flush entire data cache 
FL[0] 0 — No Action W 


] - Flush Data Cache 


34.ICCM base address, AUX. ICCM 
地 址 : 0x208 
访问 权限 : RW 


When an ICCM is attached to a processor,the AUX_ICCM register is present and identifies the regions in which the ICCMOand ICCM1 are 


contained. 


31 30 29 28 27 26 25 24 23 2221 20 19 18 17 16 15 14 13 12 11109 8 7 65432 1 0 


图 A-41 AUX ICCM,base address for ICCM (ADDR_SIZE==32) 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109 8 7 6 54 321 0 


图 A-42 AUX_ICCM,base address for ICCM (ADDR_SIZE==16) 
31 m m-l] m-5 m 一 8 0 
图 A-43  AUX  ICCM,base address for ICCM (ADDR_SIZE==m) 
35.DCCM base address, AUX. DCCM 
地 址 : Ox18 
访问 权限 : RW 


When a DCCM is attached to a processor and is not the only target for data memory accesses,the AUX_DCCM register 1s present and identifies 


the region in which the DCCM 1s contained. 
Al 30 29 28 27 26: 25 24 235-22 21 ZU 19 IS Ti 16 15 P4 13 12 IL 109 8 7 06 5 ^4 3 2 I1 0 


图 A-44 AUX DCCM,base address for DCCM (ADDR_SIZE==32) 


31 30 29 28 27 26 25 24 23 222120 19 18 17 16 15 14 13 12 11109 8 7 6 54321 0 


图 A-45 AUX DCCM,base address for DCCM (ADDR SIZE--16) 


31 m m-l m-5 0 
图 A-46 AUX DCOCM,base address for DCCM (ADDR_SIZE==m) 
36.Non-cached Memory Region, AUX. CACHE LIMIT 
地 址 : 0x209 
访问 权限 : RW 


When a DCCM is attached to a processor and is not the only target for data memory accesses,the AUX_DCCM register 1s present and identifies 


the region in which the DCCM 1s contained. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 1413 1211109 8 7 6 54 3210 


Region Reserved 


图 A-47 AUX. CACHE, LIMIT;statt of non-cached regions (ADDR_SIZE==32) 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109 8 7 6 54321 0 


图 A-48 AUX_CACHE_LIMIT) start of non-cached regions (ADDR_SIZE==16) 


31 m m-l m—5 0 
图 A-49 AUX DCOCM,base address for DCCM (ADDR_SIZE==m) 
37.Timer 0 Count Register, COUNTO 
地 址 : 0x21 
访问 权限 : RW 


Writing to this register sets the initial count value for the timer,and restarts the timer.Subsequently,the register can be read to reflect the timer 0 


count progress. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109 8 7 65 43 2 1 


Timer 0 Count Value 


图 A-50 Timer 0 Count Value Register 
38. Timer 0 Control Register CONTROLO 
地 址 : 0x22 
访问 权限 : RW 
31 30 29 28 27 26 25 24 23 22 21 20 1918 17 16 15 14 131211109 87654 3 2 0 
ENEMIES 
图 A-51 Timer 0 Control Register 
The timer control register (CONTROLO) is used to update the control modes of the timer. 


Writing to CONTROLO de-asserts the timer interrupt,but does not stop the timer from counting. The timer continues counting and independently 


statt the next iteration of counting,setting COUNTO to 0,when LIMITO equals COUNTO. 


#A-19 Timer 0 Control Registet 域 定义 


位 M 描 UR 


The Interrupt Enable flag (IE) enables the generation of an interrupt after the timer has reached its 


IE "e p were . i 
limit condition. If this bit 1s not set, no interrupt is generated. 


The Not Halted mode flag (NH) causes cycles to be counted only when the processor is running (that 
NH is when the processor is not halted). When set to 0, the timer counts every clock cycle. When set to 1, 
the timer counts only when the processor 1s running. 


The Watchdog mode flag (W) enables the generation of a system watchdog reset signal after the timer 
W has reached its limit condition. If this bit is not set, no watchdog reset signal is generated. The watchdog 
reset signal is activated two cycles after the limit condition 1s reached. 


The IP bit is set when the COUNTn register reaches the LIMITn value, and remains set until cleared by the 
IP timer interrupt service routine. The IP bit can be cleared by re-writing the desired values of W, NH and IE into 
the CONTROLO register, thereby writing a 0 into the IP position. 


If both the IE and W bits are set,only the watchdog reset is activated because the ARCv2-based processor has been reset and the interrupt is 


lost.If both the IE and W bits are cleared,then the timer is automatically reset and the timer restarts its operation after reaching the limit value. 
39. Timer 0 Limit Register, LIMITO 
地 址 : 0x23 
访问 权限 : RW 


If both the IE and W bits are set,only the watchdog reset is activated because the ARCv2-based processor has been reset and the interrupt is 


lost.If both the IE and W bits are cleared,then the timer is automatically reset and the timer restarts its operation after reaching the limit value. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109 8 76543241 0 
图 A-52 Timer 0 Limit Value Register 

40.Timer 1 Count Register COUNT1 

地 址 : Ox100 

访问 权限 : RW 

31 30 29 28 27 26 25 24.23 22 21 20 19 18 17 16 15 14 13. 12 11 109 8. 76 5 43 2 1 9 
图 A-53 Timer 1 Count Value Register 

41.Timer 1 Control Register, CONTROLI 

地 址 : 0x101 

访问 权限 : RW 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 16 15 14 131211109 87654 3 2 |] O0 


图 A-54 ‘Timer 1 Control Register 


42. Timer 1 Limit Register, LIMIT1 

地 址 : 0x102 

访问 权限 : RW 

31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 111098 765 4321 0 


Timer Limit Value 


图 A-55 Timer 1 Limit Value Register 
43.RTC Control Register, AUX_RTC_CTRL 
地 址 : 0x103 
访问 权限 : SW 
31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13121 109 87654321 O0 


wl 中 


图 A-56 AUX_RTC_CTRL Register 


#A-20 RTC Control Registers Æ 5C 


位 d HO xh 
E Enable 
A value of 0 means disabled; 1 means enable counting. 
© A value of 1 clears the AUX RTC LOW and AUX RTC HIGH registers. 
ALAO These bits track the atomicity of reads from the RTC Count High Register, AUX RTC 


HIGH and RTC Count Low Register, AUX RTC LOW registers. 


44.R TIC Count High Register, AUX. RTC. HIGH 

地 址 : 0x105 

访问 权限 : r 

The RTC count high register is a read register in user mode.Reading this register returns the MSB 32-bits of the free-running RTC. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 111098 765 43 2 1 0 


Real Time Count Value [63:32] 


图 A-57 AUX_RTC_HIGH Register 
45.RTC Count Low Register, AUX_RTC_LOW 
地 址 : Ox104 
i FAX: 


The RTC count low register is a read register in user mode.Reading this register returns the LSB 32-bits of the free-running RTC. 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 111098 7 6 54 321 0 
图 A-58 AUX_RTC_LOW Register 

46.Build Configuration Registers Version, BCR_VER 

地 址 : Ox60 

访问 权限 : R 

The Build Configuration Registers Version (BCR_VER) specifies which build configuration register implementation is present. 

31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109 87 6 54 321 0 


图 A-59 BCR_VER Register 


表 A-21 BCR_VER Register Æ X 


位 H He x 
Version of Build Configuration Registers 
0x01 = Indicates that the BCR Region is at addresses 0x60-0x7F and ISA CONFIG only 


0x02 = Indicates that the BCR Region is at addresses 0x60-0x7F and OxC0-OxFF 
The other values for this field are reserved. 


Version 


47.BTA Configuration Register,BTA, LINK, BUILD 

地 址 : 0x63 

访问 权限 : R 

Al 30:29 28 27 25 25 24 23 22 21 20: 19 18. 17 16 15 14.13 12:11 109.8 7 65 4.3 2 1 0 


ee 


图 A-60 BTA_LINK_BUILD Register 


表 A-22 BTA_LINK_BUILD Registet 域 定义 


位 H Hox 
Presence of BTA Registers 
P 0x0 = BTA Ll and BTA L2 registers are absent 


All other values are reserved. 


48.Interrupt Vector Base Address Configuration, VECBASE AC BUILD 


地 址 : 0x68 


访问 权限 : R 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 1211109 8765432 1 0 
ADDR[31:10] Reserved 


图 A-01 VECBASE_AC_BUILD Register 


表 A-23 VECBASE_AC_BUILD Registet 域 定义 


位 dk H 述 


Version of Interrupt Unit 


Version . 
0x04 = ARCv2 Interrupt Unit 


Interrupt Vector Base Address. This value of the ADDR field is configured at build time 


ADDR[31:10 . 
BE through the -intvbase_preset parameter. 


49.Core Register Set Configuration Register,RF_BUILD 
地 址 : Ox6E 
访问 权限 : R 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 131211109 8 7654321 0 


[owe [ppp von 


图 A-62 RF BUILD Register 


表 A-24 RF BUILD Registet 域 定义 


位 域 MEE. 


Version of Core Register Set 


Version 
0x02 = Current Version 


Number of Ports 
P 0x0 = 3-port register file 
0x1 = 4-port register file 


Number of Entries 
E 0x0 = 32-entry register file 
0x1 = 16-entry register file 


E 
过 
at 
Ist 


Reset State 
R 0x0 = Not cleared on reset 
0x1 = Cleared on reset 


Number of Register Banks in addition to the main core register bank 
0x0 = 0 additional register bank 


B " 
0x1 = 1 additional register banks 
0x2 .. 0x7 = Reserved values 
Number of duplicated registers in each additional register bank 
0x0 = 4 duplicated registers 
D 0x1 = 8 duplicated registers 


0x2 = 16 duplicated registers 
0x3 = 32 duplicated registers 
Note: This field returns 0 when RF BUILD.B - 0, that is there are no additional register banks. 


50.Data Cache Build Register, D CACHE BUILD 


地 址 : 0x72 


访问 权限 : R 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109 8 765 432 1 


ee [ov [e ve 


图 A-63 D CACHE BUILD Register 


#A-25 D CACHE, BUILD Registet 域 定义 


位 m He x 


Version number 
0x0 = No D CACHE BUILD register 
Ox 1 = reserved 


Version| 7:0] 0x2 = ARCompact, fixed 32-byte line size 
0x3 = ARCompact, variable line size 
0x4 = ARCv2 


All other values are reserved 


Cache Associativity 
0000 = Direct-mapped (1-way set associative) 
ee 0001 = Two-way set associative 
0010 = Four-way set associative 
0011 = Eight-way set associative 
All other values are reserved 


Cache capacity 
0000 = Reserved 
Capacity[ 15:12] 0001 = 1 Kbytes 


0010 = 2 Kbytes 
0011 = 4 Kbytes 


0100 = 8 Kbytes 

0101 = 16 Kbytes 

0110 = 32 Kbytes 

0111 = 64 Kbytes 

All other values are reserved 


Block Size, indicates the cache block size in bytes 
0000 = 16 bytes 
0001 = 32 bytes 
BSize[ 19:16] 0010 = 64 bytes 
0011 = 128 bytes 
0100 = 256 bytes 
All other values are reserved 


Feature Level, indicates locking and debug feature level 
00 = Basic cache, supports cache flush operations, but no locking or debug features 
FL[21:20] 01 = Lock and flush features are supported 
10 = Lock, flush, and advanced debug features are supported 
11 =reserved 


51.Processor Timers Configuration Register, TIMER. BUILD 


地 址 : 0x75 
访问 权限 : R 
31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 9 8 76543210 


[mee | n | m [ems feni] vm 


图 A-64 TIMER. BUILD Register 


#A-26 TIMER BUILD Registet 域 定义 


位 域 +i 述 
Current version 
0x01 = Version 1 
Version 0x02 = ARC 700 Processor Timers 


0x03 = ARC 600 R3 Processor Timers, with interrupt-pending bits 
0x04 = ARCv2 Processor Timers 


Timer 0 Present 
TO 0x0 = No timer 0 
0x1 = Timer 0 present 


Timer 1 Present 
Tl 0x0 = No timer 1 
0x1 = Timer | present 


m. 
x D. 
1 ar 
wii 


\ 
é 


EF 
E 
zm 
st 


64-bit RTC Configuration 
RIC 0x0 = 64-bit RTC is disabled. 
Ox 1 = 64-bit RTC is enabled. 


Indicates the interrupt priority level of Timer 0 


Ky Note: If Timer 0 is not included, this field is always set to 0. 


Indicates the interrupt priority level of Timer 1 


Pi l ; l 
Note: If Timer 1 is not included, this field is always set to 0. 


52.DCCM RAM Configuration Register, DCCM_BUILD 
地 址 : 0x74 
访问 权限 : R 
31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 1110 9 8 7654321 0 


图 A-65 DCCM_BUILD Register 


#A-27 DCCM_BUILD Registet 域 定义 


位 dm He xh 
Version Current version 0x3 
Size of DCCM RAM 
0x0 = Not present 
0x1 = 512B 
0x2 = IKB 
0x3 = 2KB 
0x4 = 4KB 
0x5 = 8KB 
0x6 = 16KB 
0x7 = 32KB 
0x8 = 64KB 
0x9 = 128KB 
OxA = 256KB 
OxB = 512KB 
bOxC = IMB 


SIZE 


53.ICCM Configuration Register, I| CCM. BUILD 
地 址 : Ox78 
访问 权限 : R 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 10 9 8 76543210 


图 A-66 ICCM_BUILD Register 


#A-28 ICCM_BUILD Registet 域 定义 


位 Joy 摘 述 
Version Current version 0x4 


Size of ICCM0 RAM 
0x0 = Not present 
0x1 512B 

0x2 = IKB 

0x3 = 2KB 

0x4 = 4KB 

0x5 = 8KB 

0x6 = 16KB 

0x7 = 32KB 

0x8 = 64KB 

0x9 = 128KB 
0xA = 256KB 
0xB = 512KB 
0xC = IMB 


ICCMO SIZE 


Size of ICCM1 RAM 
0x0 = Not present 
0x1 = 512B 

0x2 = 1KB 

0x3 = 2KB 

0x4 = 4KB 

0x5 = 8KB 

0x6 = 16KB 

0x7 = 32KB 

0x8 = 64KB 

0x9 = 128KB 
0xA = 256KB 
0xB = 512KB 
0xC = IMB 


ICCMI SIZE 


54. Instruction Fetch Queue Configuration Register, [FQUEUE_BUILD 

地 址 : OxFE 

访问 权限 : R 

31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 131211109 8 7654321 0 


图 A-67 IPQUEUE_BUILD Register 


#A-29 IFQUEUE, BUILD Registet 域 定义 


位 H 描 xh 


Version of Instruction Fetch Queue 
0x02 


Version 


mm 
Lh 
\ < 
—" 


\ 
4 


位 dm Hi xh 


Instruction Fetch Queue entries 
0x0 — 1 entry 
BD Oxl =2 entries 
0x2 = 4 entries 
0x3 = 8 entries 
0x4 = 16 entries 


55. ISA CONFIG 
地 址 : OXCI1 


访问 权限 : R 


31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 111098 765432 1 


> | e [oae] soon | ines | es 


图 A-68 ISA_CONFIG Build Register 


表 A-30 ISA CONFIG Registet 域 定义 


位 K fü xh 


0x01 =ARCompact V1 version 


Version 0x02 =ARCv2 version 


0000 =16-bit width 
0001 =20-bit width 
PC SIZE 0010 —24-bit width 
0011 —28-bit width 
0100 =32-bit width 


0000 =Zero overhead loop not supported 
0001 =8-bit width 

0010 =12-bit width 

0011 =16-bit width 

0100 =20-bit width 

0101 =24-bit width 

0110 =28-bit width 

0111 =32-bit width 


LPC SIZE 


0000 =16-bit width 
0001 =20-bit width 
ADDR SIZE 0010 =24-bit width 
0011 =28-bit width 
0100 =32-bit width 
0 = Little-Endian byte ordering 


B (ATOMIC_OPTION 
( 一 ) | = Big-Endian byte ordering 


As 
|t i 
1 < 
We 


\ 
é 


位 H 描 xh 


0 - LLOCK and SCOND instructions are absent 


A (ATOMIC OPTION) 
一 1 = LLOCK and SCOND instructions are present 


0 = Code density optional instructions are absent 

1 = Code density version | optional instructions are present 
2 = Code density version 2 optional instructions are present 
All other values are reserved 


C (CODE DENSITY OPTION) 


0 = DIV/REM instructions are absent 

] = Bit-serial DIV, DIVU, REM and REMU implementation 

2 = Radix-4 fast DIV, DIVU, REM and REMU implementation 
All other values are reserved 


D (DIV REM OPTION) 


56.Interrupt Build Configuration Register, [RQ BUILD 
地 址 : OxF3 
访问 权限 : R 


30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12111098 76 5432 1 0 


图 A-69 IRQ BUILD Register 


表 A-31 IRQ BUILD Register3i E 3t 


位 m 描 OR 
Version Version of the Interrupt Controller 
0x01 = ARC v2 
IRQS[7:0] Indicates the number of interrupts configured in the Interrupt Controller. 
EXTS[7:0] Indicates the number of external interrupt lines configured in the Interrupt Controller. 
P[3:0] Contains N-1, when N interrupt priority levels are configured. 
F Value of the FIRQ OPTION configuration option 


附录 B ARC 指令 速 查 表 


32 位 指令 


Bi 
Is 


- 
LI 
file 


绝对 值 


市 进 位 加 


=? 
= 


左 移 1 位 加 

左 移 2 位 加 

左 移 3 位 加 

核心 寄存 器 交换 辅助 寄存 器 内 容 
逻辑 与 

算术 左 移 

算术 右 移 
TANE 16 位 
RAAB 8 位 

如 果 位 为 0 则 分 支 转移 
如 果 位 为 1 则 分 支 转 移 
无 条 件 分 文 转 移 

条 件 为 真 分 文 转移 

EE ii (to 0 ) 

分 支 索引 ，32-bitf 全 字 表 
分 支 索 引 ，32-bitf 半 字 表 
按 位 取 反 相 与 
分 支 和 链接 

位 屏蔽 

位 屏蔽 失效 

分 支 比较 


BCLR S 


BIC S 
BL S 
BMSK S 


BRcc S 


tHE in (to 0) 


按 位 取 反 相 与 
分 文 和 链接 
位 屏蔽 


分 文 比较 


16 位 指令 
H $ 描 述 
ET 


KFLAG 
LD LDH LDWDB 
LDI 


LLOCK 
LPec 
LR 
LSLI16 
LSL8& 
LSR 
LSRI16 
LSRS8 


32 位 指令 


ni 
> 


HAT (停止 ) 处 理 器 
指定 位 置 1 (to 1) 
指定 位 测试 值 

位 异 或 


zn 
Si 


比较 CMP S 


= 
XR 
QD 
i 
E 
% 


零 扩展 字 节 


FP JE 16 位 半 字 
查找 首 地 址 

写 状 态 寄存 器 
查找 尾 地 址 

Dee 

忠 : 转 与 链接 


EL | 


WIZE RAS BY FF it 


从 内 存 加 载 
负载 索引 | LDI S 


E 
V 
v 


负载 锁定 


循环 〈 零 开销 循环 ) 
从 辅助 存储 需 加 载 
逻辑 左 移 16 位 
逻辑 左 移 8 位 
逻辑 右 移 

WA AAS 16 位 
逻辑 右 移 8 位 


LSR S 


(5E) 


16 位 指令 


i] 述 
“Pb (停止 ) 处 理 需 
指定 位 置 1 (to 1) 
指定 位 测试 值 


执行 索引 
PRA IF LA Ae 


零 扩 展 字 节 
EP mé 16 位 半 字 


EE 
BERE 
BERE Aj ETE SR | 


从 内 存 加 载 


负载 索引 
PK ŠK RU JI 


逻辑 右 移 


32 位 指令 16 位 指令 


oH 
" 
少 


TE 
MAX 返回 最 大 值 
MIN 返回 最 小 值 


MOV 移动 (F501) 到 寄存 器 MOV_S 
wey wv s 
MPYM MPYH 32x32 "WW FT r (msw) 

MPYU 32X32 无 符号 乘 (Isw) 

MPYW 16 X 16 带 符号 乘 

NEG NEG S 
NOP AERE NOP S 
NORM 

NORMH NORMW 16 位 标准 化 

NOT 32 HEE FEC E IZ NOT_S 


RCMP 取 反 比较 
REM 有 符号 整数 差 
REMU 无 符号 整数 差 


= 
RoR 
= 
= 
MÀ 
v 
— 
— 
m 


SCOND 条 件 存 储 


移动 (F601) 到 寄存 器 
32 x 32 WTS FE (sw) 


无 效 使 能 
零 操作 


逻辑 按 位 取 反 
逻辑 或 
TV id MER AT TE 


Arf ar run EU HER 


指 a 
SE Tce 

SETI 

SEXB 

SEXH SEX W 
SLEEP 

SR 

ST 

SUB 

SUBI 

SUB2 

SUB3 

SWAP 
SWAPE 

SWI 

SYNC 


TST 
XOR 


32 位 指令 16 位 指令 


HR | C 
中 晰 使 能 置 SS 


符号 扩展 半 字 
EE | 
一 wm 0| 
ww es — 
Cw O 
| 
ai | 
rr | 


附录 C 术语 及 缩 略 语 


ABI: Application Binary Intetface， 应 用 程序 二 进 制 接 口 。 


ALU: Arithmetic Logical Unit, # i944 % 76. 


ARChitect: 是 Synopsys 公 司 针 对 ARC 处 理 器 特有 的 可 配置 性 和 可 扩展 性 开发 的 一 款 


完成 处 理 器 


ASIL: Automotive Safety Integration Level， 汽 车 安全 完整 性 等 级 ， 共 有 4 个 等 级 ， 分 


Auxiliary Register: 


BCR: Build Configuration Register, &&4F (或 核 ) 配置 信息 寄存 器 ， 辅 助 寄存 器 组 中 有 一 类 特殊 的 辅助 寄存 器 


辅助 寄存 器 。 


器 及 其 各 功能 模块 的 版 本 信息 和 详细 配置 信息 。 


符号 扩展 16 位 半 字 


和 仓储 到 内 和 存 
减 


RAE A er 


陷入 到 系统 调用 
测试 

逻辑 异 或 

未 执行 的 指令 


配置 软件 ， 帮 助 设 计 工 程 师 根据 应 用 的 需求 快速 
结构 配置 以 及 RTL 人 代码、 测试 激励 和 后 端 参 考 流 程 脚 本 (如 ASIC 或 FPGA 的 综合 、 布 局 布线 、 


序 约束 文件 等 ) 生成 。 


别 为 A、B、C、D， 其 中 A 是 最 低 的 等 级 ，D 是 最 


， 用 于 保存 硬件 中 处 理 


Big-endian: 大 端 格式 ， 是 指 字 数据 的 高 字 节 放置 在 低地 址 中 ， 而 低 字 节 数 据 放 置 在 高 地 址 中 。 
BSP: Board Support Package， 板 级 支持 包 。 

BVCI: Basic Virtual Component Interface， 基 本 的 虚拟 元 件 接口 。 

CCM: Closely Coupled Memory, XAAR. 

CISC: Complex Instruction Set Computer, 4 2846 44 t> HAH. 

CMOS: Complementary Metal Oxide Semiconductof， 互 补 金属 -氧化 物 -半导体 。 
Core Register: 核心 寄存 器 。 

CPU: Central Processing Unit， 中 央 处 理 器 。 

DMA: Direct Memory Access 存 储 器 直接 访问 。 

DMI: Direct Memory Interface, HANAR., 

DSP: Digital Signal Processing, 243 5 4b EE. 


embARC: 是 为 ARC 处 理 器 ， 特 别 是 ARC EM 系列 处 理 器 的 开发 而 提供 的 一 个 开源 软件 平台 ， 包 含 大 量 的 软件 资源 和 说 明文 档 以 帮助 
用 户 基 于 ARC 处 理 器 快速 开发 丰富 的 上 层 应 用 程序 。 


Embedded System: AAA Ao 

FIFO: First In First Out, AAH. 

FPGA: Field Programmable Gate Atray， 现 场 可 编程 门 阵列 。 

GPIO: General Purpose Input/Output， 通 用 IO 端口 。 

IDE: Integrated Development Envitonment， 集 成 开发 环境 。 

Illegal Insttuction exception: 非法 指令 异常 。 

IoT: Internet of Things， 物 联网 。 

ISA: Instruction-Set Atchitectufe， 指 令 集 体系 结构 。 

ISR: Interrupt Service Routines 中 断 服务 程序 。 

ISO: International Organization for Standatdization， 国 际 标 准 化 组 织 。 


JTAG: Joint Test Action Group， 联 合 测 试 工作 组 。 


3n 


Little-endian: 小 端 格 式 ， 是 指 字 数据 的 高 字 节 放 置 在 高 地 址 中 ， 而 低 字 节 数 据 放置 在 低地 址 中 。 
MQX: Message Queue eXecutive， 消 息 队 列 执行 。 


MWDT: MetaWare Development Toolkit，MetaWare 开 发 套件 包含 了 对 ARC EM 处 理 器 进行 编程 、 仿 真 以 及 调试 的 所 有 软件 工具 ， 如 
编译 器 (compiler) 、 汇 编 器 (assembler) 、 链 接 器 (linker) 、 调 试 器 (debugger) . GAB (simulator) 以 及 集成 的 图 形 化 界面 


MetaWare IDE. 


PPA: Performance/Powet/Atrea， 性 能 / 功 耗 /效率 。 


Vv, 


PC: Program Counter, FHAR. 

Register Bank: 寄存 器 体 。 

RISC: Reduced Instruction Set Computer， 精 简 指 令 集 计算 机 。 

RTIE: Return from interrupt or exception, P Br AF it IRAE Pik Fl. 


RTOS: Real Time Operating System K 时 操作 系统 。 


SVR3: System V Release 3， 在 1987 年 公开 。 它 包括 STREAMS， 远 程 文件 共享 (remote file sharing, RFS) ， 共 享 库 ， 以 及 Transpott 


Layer Interface (TLI) 。 


SVR4: System V Release 4.0， 在 1989 年 11 月 1 日 公开 ， 并 于 1990 年 发 布 。 是 UNIX Systems Labotatofies 和 Sun 联 合 进行 的 项 目 


了 来 自 Release 3、4.3BSD、Xenix， 以 及 SunOS 的 技术 。 


zeto-ovethead: 零 开 销 。 
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